PARL高性能强化学习框架
PARL 是一个高性能、灵活的强化学习框架。PARL 的目标是构建一个可以完整复杂任务的智能体。
下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
特点
- 可复现性保证。我们提供了高质量的主流强化学习算法实现,严格地复现了论文对应的指标。
- 大规模并行支持。框架最高可支持上万个 CPU 的同时并发计算,并且支持多 GPU 强化学习模型的训练。
- 可复用性强。用户无需自己重新实现算法,通过复用框架提供的算法可以轻松地把经典强化学习算法应用到具体的场景中。
- 良好扩展性。当用户想调研新的算法时,可以通过继承我们提供的基类可以快速实现自己的强化学习算法。
框架结构
评论
AdeptRLAI 强化学习框架
Adept是一种强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供:多GPU训练使用自定义网络,代理和环境的模块化界面PyTorch的基线强化学习模型和算法内置张量板日志记录
AdeptRLAI 强化学习框架
0
MindSpore Reinforcement强化学习框架
MindSporeReinforcement是一个开源的强化学习框架,支持使用强化学习算法对agent进行分布式训练。MindSporeReinforcement为编写强化学习算法提供了干净整洁的AP
MindSpore Reinforcement强化学习框架
0
CoachPython 强化学习研究框架
Coach是Intel Nervana开源的一个强化学习研究框架,包含许多最先进的算法的实现。该框架利用多核CPU处理能力,用于训练和评估增强学习Agent。Coach包含一些领先的增强学习算法的多线
CoachPython 强化学习研究框架
0
RL CoachPython 强化学习框架
RLCoach是一个Python强化学习框架,由英特尔2017年推出,包含许多最先进算法的实现。RLCoach只是英特尔真正的人工智能生态系统中的几个工具之一。它以模块化的方式对代理和环境之间的交互进
RL CoachPython 强化学习框架
0