Dopamine基于 Tensorflow 的强化学习框架

联合创作 · 2023-09-26 04:45

Dopamine 是由 Google AI 实验室推出的一个基于 Tensorflow 的强化学习(RL)框架,旨在为新手和资深 RL 研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 遵循以下设计原则:

  • 简单的实验:让新用户轻松运行基准实验。

  • 灵活的开发:让新用户轻松尝试研究创意。

  • 紧凑而可靠:为少数经过实战考验的算法提供实施方案。

  • 可重复性:促进结果的可重复性。

浏览 9
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报