Super-mario-bros-A3C-pytorch超级马里奥的 A3C 算法
Asynchronous Advantage Actor-Critic (A3C) for playing Super Mario Bros 是超级马里奥兄弟的 A3C 算法,用于训练代理玩超级马里奥兄弟。
它可以:
- 通过运行 python train.py 来训练模型
- 通过运行 python test.py 来测试已经过训练的模型
样本示例:
要求:
- python 3.6
- gym
- cv2
- pytorch
- numpy
评论