OpenAI Gym强化学习算法工具包-技术圈

OpenAI Gym强化学习算法工具包

联合创作 · 2023-09-26 05:05

OpenAI Gym 是一个用于开发和比较强化学习算法的工具包。

gym 不对代理的结构做任何假设，并且与任何数值计算库兼容，例如 TensorFlow 或 Theano。

有关 OpenAI Gym 的白皮书，请访问 http://arxiv.org/abs/1606.01540，这里有一个 BibTeX 条目，可以在出版物中引用它：



@misc{1606.01540,

  Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},

  Title = {OpenAI Gym},

  Year = {2016},

  Eprint = {arXiv:1606.01540},

}

Basics

强化学习有两个基本概念：环境（即外部世界）和代理（即你正在编写的算法）。代理向环境发送操作，环境回复观察和奖励（即分数）。

核心的 gym 界面是 Env，它是统一的环境界面。没有代理商界面。以下是应该了解的 Env 方法：

reset(self):：重置环境的状态。返回观察。

step(self, action)：一步一步进入环境。返回观察、奖励、完成、信息。

render(self, mode='human')：渲染一帧环境。默认模式将执行人性化的操作，例如弹出窗口。

安装

可以执行最小的安装：



git clone https://github.com/openai/gym.git

cd gym

pip install -e .

可以直接从 PyPI 进行最小的打包版本安装：



pip install gym

可以立即运行一些环境：

算法

toy_text

classic_control（需要 pyglet 来渲染）

建议首先使用这些环境，然后再安装其余环境的依赖项。

编辑分享