斯坦福新书《决策算法》发布,全文400多页PDF免费下载!
新智元报道
新智元报道
来源:外媒
编辑:keyu
【新智元导读】最近,斯坦福大学发布了一则新书《决策算法》,该书主要阐述了不确定性决策的算法,面向的是高年级本科生、研究生和专业人员,全书PDF资源都可免费下载哦!
Mykel J.Kochenderfer教授带领的斯坦福智能系统实验室(SISL)实验室,每年在计算机领域各大顶级会议和期刊上收获颇丰,仅在2021年这一个月里,实验室已经有9篇论文于AAAI2021,AAMAS2021,AIAA Journal等顶级会议和期刊上发表。
在这里简单介绍下,斯坦福智能系统实验室(SISL)的研究主要是关于用于设计鲁棒决策系统的先进算法和分析方法。
其中,实验室特别感兴趣的细分领域有:系统的空中交通管制,无人驾驶飞机和其他需要在不确定动态环境下,在保持安全和效率的同时,需要做决策的航空航天应用。
SISL主要集中在对高效的计算方法的研究上,重点关注如何从高维、概率的问题中推导出最优的策略决策。
图:SISL成员合照
这本新书《决策算法》主要介绍了在不确定情况下的最优决策算法:
该书涵盖了与决策相关的各种主题,介绍了问题中隐含的数学公式以及解决它们的算法。此外,本书中添加了许多举例和练习题,来传达各种方法下蕴含的直觉。
此书是为高年级本科生和研究生以及专业人员准备的。要学习这本书的内容,阅读者需要有一定的数学功底,并接触过多变量微积分,线性代数,和概率的概念。
这本教科书的基础是算法,并都用Julia编程语言实现。除此之外,附录中还提供了一些复习材料。
从这本书受益最大的学科有数学、统计学、计算机科学、航空航天、电气工程和运筹学。
先对本书的部分章节进行详解:
第一章:概率推理
主要讲述了概率推理(Probabilistic Reasoning),主要包括以下小节:
表示(Representation) 推理(Inference) 参数学习(Parameter Learning) 结构学习(Structure Learning) 简单决策(Simple Decisions)
第二章:序列问题
第二章:序列问题
确切解决方法(Exact Solution Methods) 近似值函数(Approximate Value Functions) 在线规划(Online Planning) 策略搜索(Policy Search) 策略梯度估计(Policy Gradient Estimation) 策略梯度优化(Policy Gradient Optimization) Actor-Critic算法(Actor-Critic Methods) 策略验证(Policy Validation)
第三章:模型不确定性
第三章:模型不确定性
探索和利用(Exploration and Exploitation) 基于模型的方法(Model-Based Methods) 脱离模型的方法(Model-Free Methods) 模仿学习(Imitation Learning)
第四章:状态不确定性
第四章:状态不确定性
信念(Beliefs) 确切信念状态规划(Exact Belif State Planning) 离线信念状态规划(Offline Belief State Planning) 在线信念状态规划(Online Belif State Planning) 控制器抽象(Controller Abstractions)
第五章:多代理系统
第五章:多代理系统
多代理推理(Multiagent Reasoning) 序列问题(Squential Problems) 状态不确定性(State Uncertainty) 协作代理(Collaborative Agents)
评论