【模仿学习】南京大学&港中文联合总结: 29页中文详述模仿学习完整过程

共 544字，需浏览 2分钟

·

2021-09-02 13:41

深度强化学习实验室

来源：南京大学, 香港中文大学团队

作者: 许天,李子牛,俞扬

模仿学习，是一种从专家示例中进行学习的方法。这里专家示例指的是由最优（或者次优）策略采集到的状态-动作序列，智能体便是通过模仿专家示例来学习策略。模仿学习主要包含两大类算法框架：行为克隆和对抗式模仿学习。

基于这两种算法框架，研究者们提出了各种各样的模仿学习算法，在实验中取得了很好的效果。尽管已经有很多对模仿学习算法的实验研究，关于模仿学习算法的理论分析直到最近才被逐步建立和完善。这些理论结果很好地解释了算法的实验现象，并且对今后的算法设计也有启发。

模仿学习简要教程着重从统计学习理论的角度来介绍模仿学习算法，能使读者对模仿学习算法有深刻的理解，使读者能够通过借助理论来分析已有的实验结果、并且设计更好的算法。

教程细节

完整版PDF下载方式:

https://www.lamda.nju.edu.cn/xut/Imitation_Learning.pdf

浏览 48

点赞

收藏

分享

举报

评论

图片

表情

实时中文语音克隆,声音模仿如此简单

开源你我他

一文全览 | 模仿学习最新进展

AI人工智能初学者

大数据学习完整学习路线

SVStatusHUD模仿 HUD

SVStatusHUD模仿在HUD上显示方向锁\静音和IOS的音量变化。它应该只用于硬件或其他重要通知（例如配件是由您的应用程序检测时）。

ASRT基于深度学习的中文语音识别系统

ASRT是一个基于深度学习的中文语音识别系统，全称为AutoSpeechRecognitionTool。此项目使用Keras、TensorFlow，基于深度卷积神经网络和长短时记忆神经网络、注意力机制

Maven学习总结

ASRT基于深度学习的中文语音识别系统

ASRT基于深度学习的中文语音识别系统

基于深度学习的中文文本分类综述

来源：专知本文为论文介绍，建议阅读5分钟本文将简要介绍传统机器学习的文本分类方法，详细阐述使用深度学习的文本分类方法。大数据时代，随着社交媒体的不断普及，在网络以及生活中，各类文本数据日益增长，采用文本分类技术对文本数据进行分析和管理具有重要的意义。文本分类是自然语言处理领域中的一个基础研究内容，

SVStatusHUD模仿 HUD

SVStatusHUD 模仿在 HUD 上显示方向锁\静音和 IOS 的音量变化。它应该只用于硬

VIO学习总结

小白学视觉

点赞

收藏

分享

举报