写了本机器学习入门书
共 1785字,需浏览 4分钟
·
2022-02-26 18:08
最近写了一本机器学习的入门书,针对初学者,希望能给初学者雪中送炭。
黄海广
动机
作为计算机方向的博士,本人一直热衷于帮助机器学习初学者入门方面的工作,主持和参与了很多国内外优秀作品的翻译、代码复现工作,比较有代表性的是吴恩达老师的机器学习课程的翻译工作,以及机器学习和深度学习笔记的撰写,帮助了很多初学者。
博士毕业后,我成为一名大学教师,同时承担了本科生和研究生的机器学习课程的教学工作。在教学过程中,我学习和借鉴了国内外很多非常优秀的机器学习课程或作品(如吴恩达老师的机器学习课程、李航老师的统计学习方法、周志华老师的机器学习等),经典是只能学习,不能超越。
站在巨人的肩膀上,本人决定写一本适合本科生和初学者的机器学习入门书,以方便只有本科三年级数学水平的学生入门。
这本书将在清华大学出版社出版,目前已经交稿,预计6个月内出版。
本书正文300多页,此外还包含代码、课件、视频、教学大纲、教学进度。不仅适合初学者学习,也适合新手老师授课。
内容简介
这本书的初稿于2021年3月完成,并根据初稿的内容进行授课,经过三轮授课,我们团队对其中的部分内容进行了调整,更适合初学者学习,同时,根据本书的内容,制作了慕课,并通过中国大学慕课向读者开放,第一轮学习者超过1.1万人,属于比较热门的课程。
这本书的课件和代码,已经在Github进行分享,原版课件分享给了国内700多位大学教师,也收到了很多宝贵的意见。
在本书中,我们主要讲解经典的机器学习算法,如线性回归、逻辑回归、决策树等,也将讲解近几年才出现的如XGBoost、LightGBM等集成学习算法,每章都有代码,以及20题以上的练习题。此外,这本书还会讲解利用机器学习解决问题的实用技术,还包括Python、Scikit-learn工具的使用等等。
本书定位为入门基础课,通过这本书,学习者将初步理解主流的机器学习算法,并且可以用机器学习技术解决现实生活中的问题。
本书对初学者来说,属于“雪中送炭”,而不是“锦上添花”,更适合初学者学习,主要解决初学者的三个问题:
(1)资料太多,难以取舍。
(2)理论性强,初学比较困难。
(3)代码资料比较少。
只要有本科三年级以上的数学知识,会一种编程语言,就可以掌握这本书的绝大部分内容。
本书共有15章,本书结构大体分为:监督学习、无监督学习两个部分。监督学习介绍了多种常见的机器学习算法,如KNN、线性回归、SVM、神经网络、朴素贝叶斯、逻辑回归、集成学习等分类算法和回归算法。无监督学习则聚焦于聚类、降维、关联规则等几大问题,并对K-means、PCA等代表算法进行了介绍,此外,还对关联规则的主要算法进行讲解。此外,本书的第2章为选修内容,附上了所需的数学知识回顾供同学们参考。
本书可以作为专科生、本科生、研究生的教材,作为本科生的教材时,第2章数学基础回顾和第11章人工神经网络可以作为选修部分,建议课时:理论课32课时,实验课16~32课时;作为专科生的教材时,建议配合代码进行课程讲解,增加实验部分课时,减少理论部分课时,建议课时:理论课32课时,实验课32课时;作为研究生的教材时,建议课时为36课时,实验部分建议自学。
相关资源
这本书的视频内容已经在中国大学慕课进行授课,目前是第二轮了。慕课地址:
https://www.icourse163.org/course/WZU-1464096179
课程资源(pdf版本课件和代码)公布在Github:
https://github.com/fengdu78/WZU-machine-learning-course
本书的课件和教案,可以分享给在职的教师,请用edu邮箱联系我:haiguang2000@wzu.edu.cn
在本书的编写过程中,得到了很多人的支持和帮助,如李航老师和徐亦达老师,对我的工作十分支持,在此表示感谢!
本人水平有限,如有公式、算法错误,欢迎各位读者指正批评。
书名暂定《机器学习入门基础》(征集书名和封面了!)
机器学习交流qq群955171419,加入微信群请扫码: