Super-mario-bros-A3C-pytorch超级马里奥的 A3C 算法

联合创作 · 2023-09-30 10:49

Asynchronous Advantage Actor-Critic (A3C) for playing Super Mario Bros 是超级马里奥兄弟的 A3C 算法,用于训练代理玩超级马里奥兄弟。

它可以:

  • 通过运行 python train.py 来训练模型
  • 通过运行 python test.py 来测试已经过训练的模型

样本示例:

要求:

  • python 3.6
  • gym
  • cv2
  • pytorch
  • numpy
浏览 7
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报