机器学习入门课程怎么选?网上热门课程测评来了!!!
引言
机器学习是一门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科的多3领域交叉学科,在当下各个领域运用十分广泛。不仅是业内人士,许多业外人士为了丰富自己的知识涉猎领域,提升自身竞争力,也或多或少的开始尝试接触机器学习。但是对于初学者来说,选择一个真正适合自己的课程,往往是一个令人头大的问题。
在这篇文章中我总结了四个网上比较受欢迎的课程,在讲师、课程内容、亮点、局限性、课程难度、建议基础知识几个方面进行了对比,希望对大家有所帮助。
1. 李宏毅 - 机器学习公开课
讲师
李宏毅现任台湾大学电气工程助理教授,研究重点是机器学习,特别是深度学习领域。他的一系列机器学习课程公开课视频,被很多人在机器学习领域当做入门教材。
李老师的课程中干货满满,其课程视频被许多人称赞为最好的中文机器学习课程视频。李老师的讲课风格偏向于幽默风趣,经常会使用一些卡通形象来增加课程的趣味性。一些晦涩难懂的理论知识,在他形象生动的讲解下往往会变的容易掌握。
课程内容
这门课程在内容方面其实更加偏向于深度学习领域,相对来说比较进阶,但李宏毅老师自信的表示,这并不会影响这门课“机器学习入门课”的属性,仍然会让绝大多数人听得懂,大家仍然可以尝试着将它作为机器学习的第一门课。
既然是入门课,那它的课程设置必然就相对比较容易上手,“从最基本的观念讲到最前瞻的技术”是这门课的一大特色,其2021年的课程是这样设置的:
课程介绍
深度学习
自注意力
机器学习理论
Transformer
生成式模式
自监督学习
可解释AI / 对抗攻击
域自适应 / 强化学习
量子机器学习
终身压缩
元学习
亮点
李宏毅老师的课程总结下来有两大亮点:
1. 结合卡通形象来讲解理论知识,风格幽默风趣、生动形象
2. 适合初学者,有配套作业题
3. 使用Python作为编程语言,对大多数初学者比较友好
局限
这门课许多人誉为机器学习领域最好的中文入门课程,确实难以找出值得指点的不足之处。对有些完全没有接触过机器学习的同学来说,独自完成其课后作业也许有些吃力,去网上找到一些配套答案或者编码思路也是一件让人头疼的事。
课程难度
这是一门适合初学者的入门课程,重点偏向于深度学习,想对深度学习有所了解的同学可以尝试去听听看。
基础知识
这门课需要提前掌握数学和编程上的一些基础知识。
数学上需要掌握:微积分、线性代数、概率论;
编程上需要掌握:Python相关语法、套件。在课程中需要能读懂并修改课上给出的一些范例代码,老师会默认你已经基本掌握Python语法。
2. 贪心科技 - 人工智能与机器学习
讲师
贪心科技是一家热门的专注于AI教育的科技公司,核心团队由海内外AI专家组成,旗下目前已经出品了好几门出色的AI领域课程。这门课程是由贪心科技团队的李文哲和Jerry Yuan讲师合作进行讲授,课程之外还专门配备了多名助教老师负责课后答疑以及作业批改工作。
李文哲
曾任金融科技独角兽公司的首席科学家、美国亚马逊的高级工程师,先后负责过聊天机器人、量化交易、自适应教育、金融知识图谱等项目,并在AAAI、KDD、AISTATS等顶会上发表过15篇以上论文,并荣获IAAI,IPDPS的最佳论文奖,多次出席行业峰会发表演讲。分别在USC, TAMU,南开攻读博士、硕士和本科。在荷兰访问期间,师从AI顶级学者Max Welling教授。
Jerry Yuan
拥有14年人工智能、推荐系统、自然语言处理、数字图像和视频处理项目经验,主导多款核心推荐系统的研发,是人工智能、分布式系统、云计算方面的专家。曾师从中国科学院王守觉院士从事人脸识别研究、共同发表论文。在美国博士期间,主要研究NASA(美国航天局)支持的基于人工智能的空间天气预测项目。先后在AI相关会议和杂志上发表过15篇以上的论文。
课程内容
这门课程主要面向想系统性学习AI的在职人士(IT、运营、产品、财务等等)以及在校学生,通过这门课程的学习可以为后续的转型做准备,或者用这些学到的技术来提升工作的效率。在课程当中,所有核心机器学习算法背后的技术细节以及推导都得到了全面的阐述。除了每章之后的作业之外,课程中间还单独设置了几个实训章节(见下图),因此相较于诸如吴恩达等老师侧重于理论方面的教学模式,这门课程更加偏向于理论与实战的结合。
每次实训作业的时候,作为新手免不了会遇到很多解决不掉的难题,贪心科技的课程相较于公开课而言,课后配置的助教答疑以及作业批改环节是一个很大的亮点。
这门课程全套共有17个章节,其中包括5个项目作业章节,所有的实训案例都来自医疗、生物、社会科学等十几个不同领域,与现实生活十分贴切,比如第一个项目作业“广告点击率预测”,就是去设计一个算法来匹配平台用户与广告,达到撮合广告主与平台之间双方利益的目的。相较于网上可以找到的公开课而言,它的内容覆盖非常全面。从它的课程目录中我们就可以看出:
人工智能基础
线性回归
逻辑回归
模型泛化
【项目作业】-广告点击率预测
朴素贝叶斯
【项目作业】-情感分析项目
决策树
随机森林
提升树
【项目作业】-信用卡欺诈预测
K-Means
主成分分析
【项目作业】-零售场景中的用户分层
神经网络
支持向量机
【项目作业】-手势语识别
按照他们给出的学习方案,当你完整学完全套课程之后,将差不多可以达到初级算法工程师的技术标准,可以深入理解每一个机器学习算法细节和全部推导过程,并且通过大量案例的实战,获得今后独立解决任何AI问题的能力。
亮点
这门课程由于是专门面向初学者的商业课程,所以相对来说它更加注重满足用户群的需求。先来看看贪心科技官网给出的这门课程的卖点:
当然,想要知道这门课程的好坏,肯定还是亲自测评比较靠谱。在经过本人亲测之后,感觉这门课程有下面几个让我眼前一亮的闪光点:
1. 覆盖面广,基础知识讲解透彻,对初学者十分友好。
2. 实操作业多,且案例覆盖领域较广,可以及时对所学理论进行巩固和应用。
3. 不需要自己下载软件,所有练习都可在平台在线完成。
4. 有助教随时进行作业答疑。
其中,“有助教”这一点,对我来讲应该是这门课程最大的一个优势。相较于网上冰冷的自学课程而言,与助教进行有效的互动可以随时解决自己遇到的问题,省去了大把查阅资料的精力,学习起来十分省心。
局限
这门课程与免费的公开课相比,唯一的局限性可能就在于它是付费课程。但是这门课程堪比于手把手教学的讲解精细程度,以及其作为商业课程所独具的配套资源,会另人感叹付费确实有付费的道理。对于没有接触过机器学习且手头稍微宽裕的初学者来说,如果十分想要比较系统的了解机器学习的话,可以去了解一下这门课程。
课程难度
这门课适合想要转型投身AI行业的初学者,需要的基础知识不多,并且课程当中知识点讲解比较透彻,作为小白十分容易上手,再加上有助教老师的答疑,学习起来可以算是毫不费力。学完全套课程之后可以达到初级算法工程师的标准,技术上完全可以胜任。
基础知识
具备高中以上数学基础,了解简单的统计与线性代数;半年以上编程经验,包括但不限于Python。
3. 吴恩达-Machine Lerning |Coursera
讲师
吴恩达(Andrew Ng),斯坦福大学教授,谷歌大脑、Coursera的创始人之一,百度首席科学家,研究重点是深度学习。
作为斯坦福大学教授,Ng讲课风格偏向于严谨,可以把知识点往细节出深挖,课程里面用到的数学知识Ng一般都会进行耐心的讲解,这对于数学不好的同学十分友好。
课程内容
这门课程的重点是对概念的讲解,理解算法,并理解选用特定算法的原因和意义,课程相对独立。每个算法所需要的所有数学,在这门课中也得到了完整的解释。其课程结构如下:
单变量的线性回归
回顾线性代数
多变量的线性回归
Octave / Matlab教程
Logistic回归
正则化
神经网络:表示
神经网络:学习
应用机器学习的建议
机器学习系统设计
支持向量机
降维
异常检测
推荐系统
大规模机器学习
应用示例:Photo OCR
亮点
这门课程的亮点在于,对数学基础不足的同学十分友好,有单独的章节专门为同学们补习能够用到的数学知识。
局限
这门课虽然也是入门课程,并且有其独到的优势,但其局限性也是不可忽视的(个人感观):
首先,这门课程使用的开源编程语言不是目前所流行Python,而是Octave。实际上Octave算是一种学习Machine Lerning基础知识最简单的一种方式,有精力的同学可以尝试接触着了解一下。但对大多数人来说,这确实是很不友好的一点。
其次,这门课是英文授课,对英语基础不好的小白来讲又是一个致命的打击。当然网上也可以找到带有中文字幕的版本,但建议还是通过原版视频来学习这门课程的精髓。
课程难度
这门课适合数学基础薄弱的初学者,但由于使用Octave语言,为大多数初学者增加了一分障碍。并且需要一定的英语基础。
基础知识
Octave基本语法(课程当中也会带着一起了解)
英语基础
4.Jeremy - 程序员机器学习入门
讲师
Jeremy Howard,曾任Kaggle总裁和首席科学家,Fast.ai创始研究员。
相较于Ng的“数学优先”教学模式,Jeremy更加追求“代码优先”的实用路线,因此他的课程风格一般以实操训练为重点。
课程内容
根据主页介绍,这门课程主要囊括了两种模型:基于决策树的模型和基于梯度下降的模型。
由于这门课程以实操为侧重点,对数学理论及一些概念并没有做过多的阐述,因此其课程设置与其它课程比起来较为独特。具体课程设置如下:
随机森林简介
深入了解随机森林
性能、验证和模型介绍
特征的重要性、数解释器
推理与随机森林
数据产品
cython与随机森林
梯度下降和逻辑回归
正则化、学习率和NLP
NLP与柱状数据
嵌入
Rossmann问题与道德问题(用零售商Rossmann的数据集,构建模型预测销量)
亮点
这门课有三大亮点:
1. 课程轻量,总共十二节课,每节大约两个小时,学快的同学用24小时就可以从无到有实现机器学习入门。
2. 用到的编程语言容易接受,是目前流行的Python语言。
3. 课程设置偏向于实操。
局限
既然Jeremy想走实操路线,那这门课程的局限性也就显而易见。对基础不好的同学来说,这门课有些难以上手,需要自行恶补用到的数学知识。再有就是这门课同样是英文授课,英文不好的同学又需要依靠网上并不完美的翻译版本来接触这门课了(学习英语很重要呀!!!)
课程难度
课程虽然是为初学者准备的,但由于基础数学概念方面阐述的不足,以及硬核的实操训练,可能会让一些同学学起来有些吃力,加上是英语授课,所以个人感觉这门课可以作为其他课程的补充课程,不太适合直接用来入门。
基础知识
这门课需要童鞋们有一定的数学基础,特别是线性代数、微积分以及概率论;其次需要提前掌握基本的Python语法;最后就是还需要有一定的英语基础。
总结
上面比较了四门网络上比较热门的课程,可以看出,每门课都有自己的优点和不足。个人建议,作为小白可以先从免费的公开课下手,比如风格幽默风趣的李宏毅老师的公开课,通过其轻松的上课方式让自己初步了解什么是机器学习;然后如果想要真正系统学习的话,还是建议选择专业团队旗下付费的商业课程,比如刚刚提到的比较热门的贪心科技,这样会使你的学习事半功倍。
当然,一千个读者一千个哈姆雷特,上述课程只是一些比较热门的选择,只是作为参考。但一定要记住,无论选择什么课程,坚持上完永远是最重要的!!!
最后,还是预祝同学们在AI世界里玩的开心呀:)