AdeptRLAI 强化学习框架

联合创作 · 2023-09-26 05:42

Adept 是一种强化学习框架，旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供：

多GPU训练
使用自定义网络，代理和环境的模块化界面
PyTorch 的基线强化学习模型和算法
内置张量板日志记录，模型保存，重新加载，评估和渲染
经验证的超参数默认值

这段代码是抢先体验，可能会遇到麻烦。接口可能会发生变化。我们很高兴接受反馈和贡献。

性能

〜3,000步/秒= 12,000 FPS（Atari）
- 本地模式
- 64 位环境
- GeForce 2080 Ti
- 锐龙 2700x 8核
曾经在Doom比赛中获胜（Ben Bell / Marv2in）
训练 50M Steps/ 200M 帧
每集开始时最多可进行 30 次无操作
在不同的 SEED 上进行评估，而不是在训练过的 SEED 上进行评估
体系结构：Four Convs (F=32) ，然后是 LSTM（F = 512）
执行 python -m adept.app local --logdir ~/local64_benchmark --eval -y --nb-step 50e6 --env <env-id>

浏览 13

点赞

收藏

分享

举报

评论

图片

表情

RL CoachPython 强化学习框架

RL Coach 是一个Python 强化学习框架，由英特尔 2017 年推出，包含许多最先进算法的

PARL高性能强化学习框架

PARL是一个高性能、灵活的强化学习框架。PARL的目标是构建一个可以完整复杂任务的智能体。下载安装命令##CPU版本安装命令pipinstall-fhttps://paddlepaddle.org.

PARL高性能强化学习框架

PARL 是一个高性能、灵活的强化学习框架。PARL 的目标是构建一个可以完整复杂任务的智能体。下载

MindSpore Reinforcement强化学习框架

MindSpore Reinforcement是一个开源的强化学习框架，支持使用强化学习算法对age

CoachPython 强化学习研究框架

Coach 是 Intel Nervana 开源的一个强化学习研究框架，包含许多最先进的算法的实现。

MindSpore Reinforcement强化学习框架

MindSporeReinforcement是一个开源的强化学习框架，支持使用强化学习算法对agent进行分布式训练。MindSporeReinforcement为编写强化学习算法提供了干净整洁的AP

RL CoachPython 强化学习框架

RLCoach是一个Python强化学习框架，由英特尔2017年推出，包含许多最先进算法的实现。RLCoach只是英特尔真正的人工智能生态系统中的几个工具之一。它以模块化的方式对代理和环境之间的交互进

CoachPython 强化学习研究框架

Coach是Intel Nervana开源的一个强化学习研究框架，包含许多最先进的算法的实现。该框架利用多核CPU处理能力，用于训练和评估增强学习Agent。Coach包含一些领先的增强学习算法的多线

Dopamine基于 Tensorflow 的强化学习框架

Dopamine 是由 Google AI 实验室推出的一个基于 Tensorflow 的强化学习（

Dopamine基于 Tensorflow 的强化学习框架

Dopamine是由GoogleAI实验室推出的一个基于Tensorflow的强化学习（RL）框架，旨在为新手和资深RL研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发，反映了神