强化学习数学入门教程

数据派THU

共 249字,需浏览 1分钟

 · 2023-01-12

来源:专知

本文为教程介绍,建议阅读5分钟

本文旨在使听众对RL有足够的基本概念。



我向实验室成员提供了一份关于强化学习的数学深入教程。这是为了帮助成员学习RL方法并将其应用于各自的问题领域,也为了我自己深入理解RL。演讲从Atari游戏玩智能体的背景下解释学习智能体开始,并解释了典型RL方法和论文中使用的不同成本函数和术语。本演讲旨在使听众对RL有足够的基本概念,以便他们可以立即开始阅读有关RL的最新论文,并能够理解其中的术语。

https://anmolsharma.co/talk/rl-tut/



浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报