CoachPython 强化学习研究框架-技术圈

Coach 是 Intel Nervana 开源的一个强化学习研究框架，包含许多最先进的算法的实现。该框架利用多核 CPU 处理能力，用于训练和评估增强学习 Agent。Coach 包含一些领先的增强学习算法的多线程实现，适用于各种游戏和机器人环境。

Coach 是一个 Python 环境，有了 Coach，我们就有可能通过结合不同的模块对智能体建模了，也能在不同的环境中训练智能体。可使用的环境，让我们能在不同的实务领域测试智能体，比如机器人、自动驾驶汽车、游戏等。Coach 能够收集训练过程的统计数据，并支持高级可视化技术，从而 debug 训练的智能体。

Coach 有非常易于使用的 API，用于实验新的 RL 算法，并允许新环境的简单集成来解答。基本的 RL 组件（算法、环境、神经网络架构、探索策略等）能很好的解耦，因此能无痛扩展和重用现有的组件。

简单示例：



python coach.py -p CartPole_DQN -r