Super-mario-bros-A3C-pytorch超级马里奥的 A3C 算法

联合创作 · 2023-09-30 10:49

Asynchronous Advantage Actor-Critic (A3C) for playing Super Mario Bros 是超级马里奥兄弟的 A3C 算法,用于训练代理玩超级马里奥兄弟。


它可以:



  • 通过运行 python train.py 来训练模型

  • 通过运行 python test.py 来测试已经过训练的模型


样本示例:



要求:



  • python 3.6

  • gym

  • cv2

  • pytorch

  • numpy

浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报