AdeptRLAI 强化学习框架

联合创作 · 2023-09-26 05:42

Adept 是一种强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供:

  • 多GPU训练
  • 使用自定义网络,代理和环境的模块化界面
  • PyTorch 的基线强化学习模型和算法
  • 内置张量板日志记录,模型保存,重新加载,评估和渲染
  • 经验证的超参数默认值

这段代码是抢先体验,可能会遇到麻烦。接口可能会发生变化。我们很高兴接受反馈和贡献。

性能

  • 〜3,000步/秒= 12,000 FPS(Atari)
    • 本地模式
    • 64 位环境
    • GeForce 2080 Ti
    • 锐龙 2700x 8核
  • 曾经在Doom比赛中获胜 (Ben Bell / Marv2in) 
  • 训练 50M Steps/ 200M 帧
  • 每集开始时最多可进行 30 次无操作
  • 在不同的 SEED 上进行评估,而不是在训练过的 SEED 上进行评估
  • 体系结构:Four Convs (F=32) ,然后是 LSTM(F = 512)
  • 执行 python -m adept.app local --logdir ~/local64_benchmark --eval -y --nb-step 50e6 --env <env-id>
浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报