一文读懂强化学习
共 34129字,需浏览 69分钟
· 2021-08-13
点击左上方蓝字关注我们
来源 | 海豚数据科学实验室
下面简单列举一些强化学习的成功案例,然后对强化学习做简介,介绍两个例子:最短路径和围棋,讨论如何应用强化学习,讨论一些仍然存在的问题和建议,介绍《机器学习》强化学习应用专刊和强化学习应用研讨会,介绍强化学习资料,回顾强化学习简史,最后,简单讨论强化学习的前景。
1. 强化学习与相关学科的关系
2. 强化学习简介
3. 例子:最短路径
5. 更多强化学习简介
1. 如何应用强化学习
2. 强化学习现存问题及建议
实用强化学习算法,包括所有强化学习算法的挑战,尤其是在实际应用中遇到的挑战;
实际问题:泛化性、采样/时间/空间的效率、探索与利用、奖赏函数的详述(specification)与修整(shaping)、可扩展性、基于模型的学习(模型的效验与模型误差估计)、先验知识、安全性、责任、可解释性、可复制性、调超参数等等;
应用方向:推荐系统、广告、聊天系统、商业、金融、健康医疗、教育、机器人、自动驾驶、交通、能源、化学合成、药物设计、工业控制、美术、音乐、以及其它科学、工程、艺术问题。
2. 强化学习应用研讨会
AlphaStar:理解星际争霸。报告人:David Silver
如何开展强化学习应用的革命?报告人:John Langford
推荐系统中的强化学习。报告人:Craig Boutilier
Chow et al. 讨论了连续动作问题里的安全性
Dulac-Arnold et al. 讨论了强化学习应用的9个挑战
Gauci et al. 讨论了脸书的开源应用强化学习平台Horizon
Mao et al. 讨论了增强计算机系统开放平台Park
Sutton & Barto RL强化学习教科书,incompleteideas.net/boo
David Silver强化学习课程,www0.cs.ucl.ac.uk/staff
阿尔伯塔大学在Coursera上的强化学习课,coursera.org/specializa
OpenAI Spinning Up, blog.openai.com/spinnin
DeepMind & UCL 的深度学习与强化学习课程,youtube.com/playlist?
UC Berkeley深度强化学习课程,rail.eecs.berkeley.edu/
LeCun, Bengio and Hinton, Deep Learning, Nature, May 2015
Jordan and Mitchell, Machine learning: Trends, perspectives, and prospects, Science, July 2015
Littman, Reinforcement learning improves behaviour from evaluative feedback, Nature, May 2015
2. 强化学习简史
强化学习时代正在到来
注释参考文献
different from traditional software). a16z.com/2020/02/16/ the-new-business-of-ai-and-how-its-different-from-traditional-software/.
END
整理不易,点赞三连↓