TextWorld基于 Python 的强化学习代理训练环境

联合创作 · 2023-09-26 04:44

TextWorld 是微软开源的一个可扩展的引擎，可用于生成和模拟文本游戏。你可以使用它来训练强化学习（RL）代理，以学习语言理解、记忆、规划和探索等。

TextWorld 采用 Python 编写，可视为用于在基于文本的游戏上进行训练和测试强化学习（RL）代理的沙盒环境，它还可运行现有的基于文本的游戏，或用来评估 AI 代理在复杂设置中的表现。

TextWorld 包含两个主要组件：游戏生成器和游戏引擎。游戏生成器将高级游戏规范（例如房间数、对象数、游戏长度和获胜条件）转换为 Inform 7 语言的可执行游戏源代码。游戏引擎是一个简单的推理机器，通过使用简单的算法，如一步向前和向后链接，确保生成的游戏的每一步都是有效的。

浏览 27

点赞

收藏

分享

举报

评论

图片

表情

基于DQN强化学习训练一个超级玛丽

机器学习实验室

基于DQN强化学习训练一个超级玛丽

小白学视觉

Dopamine基于 Tensorflow 的强化学习框架

Dopamine 是由 Google AI 实验室推出的一个基于 Tensorflow 的强化学习（

Dopamine基于 Tensorflow 的强化学习框架

Dopamine是由GoogleAI实验室推出的一个基于Tensorflow的强化学习（RL）框架，旨在为新手和资深RL研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发，反映了神

强化学习开源环境集

人工智能与算法学习

基于强化学习的自动化剪枝模型

Tianshou（天授）基于 PyTorch 的强化学习平台

Tianshou（天授）是纯基于 PyTorch的强化学习平台，与现有的主要基于TensorFlow的强化学习库不同，Tianshou没有繁杂的嵌套类、不友好的API和速度较慢的代码，其提供了用于构建

Tianshou（天授）基于 PyTorch 的强化学习平台

Tianshou（天授）是纯基于 PyTorch 的强化学习平台，与现有的主要基于 TensorFl

基于视觉模型强化学习的通用机器人

小白学视觉

基于自适应策略转移的深度强化学习

小白学视觉

点赞

收藏

分享

举报