AdeptRLAI 强化学习框架

联合创作 · 2023-09-26 05:42

Adept 是一种强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供:



  • 多GPU训练

  • 使用自定义网络,代理和环境的模块化界面

  • PyTorch 的基线强化学习模型和算法

  • 内置张量板日志记录,模型保存,重新加载,评估和渲染

  • 经验证的超参数默认值


这段代码是抢先体验,可能会遇到麻烦。接口可能会发生变化。我们很高兴接受反馈和贡献。


性能



  • 〜3,000步/秒= 12,000 FPS(Atari)

    • 本地模式

    • 64 位环境

    • GeForce 2080 Ti

    • 锐龙 2700x 8核


  • 曾经在Doom比赛中获胜 (Ben Bell / Marv2in) 

  • 训练 50M Steps/ 200M 帧

  • 每集开始时最多可进行 30 次无操作

  • 在不同的 SEED 上进行评估,而不是在训练过的 SEED 上进行评估

  • 体系结构:Four Convs (F=32) ,然后是 LSTM(F = 512)

  • 执行 python -m adept.app local --logdir ~/local64_benchmark --eval -y --nb-step 50e6 --env <env-id>

浏览 19
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报