AdeptRLAI 强化学习框架
Adept 是一种强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供:
- 多GPU训练
- 使用自定义网络,代理和环境的模块化界面
- PyTorch 的基线强化学习模型和算法
- 内置张量板日志记录,模型保存,重新加载,评估和渲染
- 经验证的超参数默认值
这段代码是抢先体验,可能会遇到麻烦。接口可能会发生变化。我们很高兴接受反馈和贡献。
性能
- 〜3,000步/秒= 12,000 FPS(Atari)
- 本地模式
- 64 位环境
- GeForce 2080 Ti
- 锐龙 2700x 8核
- 曾经在Doom比赛中获胜 (Ben Bell / Marv2in)
- 训练 50M Steps/ 200M 帧
- 每集开始时最多可进行 30 次无操作
- 在不同的 SEED 上进行评估,而不是在训练过的 SEED 上进行评估
- 体系结构:Four Convs (F=32) ,然后是 LSTM(F = 512)
- 执行
python -m adept.app local --logdir ~/local64_benchmark --eval -y --nb-step 50e6 --env <env-id>
评论