笔记|李宏毅老师机器学习课程,视频1机器学习的简介
共 1695字,需浏览 4分钟
·
2021-03-27 05:51
《学习笔记》专栏·第1篇
文 | MLer
1375字 | 4分钟阅读
【数据科学与人工智能】开通了机器学习群,大家可以相互学习和交流。请扫描下方二维码,备注:姓名-ML,添加我为好友,诚邀你入群,一起进步。
感谢李宏毅老师的分享,他的课程帮助我更好地学习、理解和应用机器学习。李老师的网站:http://speech.ee.ntu.edu.tw/~tlkagk/index.html。这个学习笔记是根据李老师2017年秋季机器学习课程的视频和讲义做的记录和总结。因为这个视频是在Youtube上面,有些朋友可能无法观看,我把它搬运下来放在云盘上面,大家点击阅读原文,就可以直接在手机随时随地观看了。再次,感谢李老师的付出和贡献。
这门课,共有36个视频,每个视频播放的时间不一。我按着视频播放的顺序,观看,聆听和学习,并结合讲义,做学习笔记。我做学习笔记目的有三:
1 帮助自己学习和理解机器学习
2 记录机器学习的重要知识、方法、原理和思想
3 为传播机器学习做点事情
视频1:机器学习简介
一、AI、ML和DL的关系
正如李老师所讲,AI是目标,ML是一种AI手段,DL是一种ML方法。
二、机器学习是什么?
李老师说,机器学习约等于从数据中寻找一个函数。
例如:语音识别、图像识别、Playing Go、对话系统等
三、如何找到这个Function?
机器学习的框架
三部曲
第一步:定义和设计函数集(Function set)
第二步:判断函数的好坏(Goodness of function)
第三步:找到一个最佳的函数(Best function)
这个三部曲,也可以看做为机器学习的表达式、目标函数和优化策略。
你会发现,机器学习很简单,如下图所示:
这个时候,我会想到这些问题:
1 这个函数集怎么定义或者表达呢?
2 如何评价一个函数的好坏,利用目标函数来做这个事情,也就是说,一个目标函数是第一步函数集中定义的函数的函数,它是一个复合函数,这个复合函数怎么设计?
3 如何根据第二步,从函数集里面找到最佳的函数呢?
四、课程的学习地图
第一:回归任务,以预测天气PM2.5的值为例
第二:分类任务
分类与回归的差异,在于输出的类型不一样,前者是类别(二个或者多个),后者是一串数值。
分类分为二元分类和多元分类
例如:垃圾邮件识别系统,是否为垃圾邮件,二元分类;文档分类系统,输出新闻所属的类别(政治类、经济类、体育类等)
我们要完成任务,需要采用各种方法,简单方法,有线性方法Linear Model,与之对应的有非线性方法Non-linear Model,非线性模型,例如,决策树、KNN、SVM、深度学习等
回归任务和分类任务,统称为有监督学习,在训练阶段,需要提供正确的输出(Label)。实际情况中,收集大量的带有正确Label的数据集是非常困难的,有时候也会非常的昂贵。比方说,金融领域的里面,好人和坏人的标签。针对这些问题,出现了新的机器学习范式,比方说半监督学习、迁移学习或者无监督学习。
李老师,还提到了一种结构学习的任务,既不属于回归任务,又不属于分类任务,这个任务更有挑战性,意味有很多问题待思考和解决。
有监督学习,从教师指导下学习;而强化学习,从交互评价下学习。
李老师以训练一个聊天机器人为例,对比说明了监督学习和强化学习的两种不同学习模式和差异。
总之,这个学习地图,包括场景-任务-方法(算法与模型),如下图所示:
朋友们,在学习中有什么问题或者想法,请加入机器学习群,大家一起讨论,共同进步。
每周一书