我是如何成为算法工程师的,超详细的学习路线

数据管道

共 4652字,需浏览 10分钟

 ·

2020-10-15 03:03

点击上方数据管道”,选择“置顶星标”公众号

干货福利,第一时间送达


1


前言

各位十一过得如何?

假期,我回了趟老家,文章停更了几天。

写文章以来,被问到最多的问题就是「算法的学习路线」。

今天,它来了。

我会带着大家看看,我们需要学些啥,利用这个假期,我甚至还收集整理了配套视频和资料,暖男石锤啊,这期文章有用的话,别忘三连哦!

2


学习路线

主要分为 4 个部分:数学基础、编程能力、算法基础、实战。


1、数学基础

在机器学习算法中,涉及到最为重要的数学基本知识有两个:线性代数概率论

这两也是大学的必修课了,如果知识早已还给老师,也没关系,哪里不会学补哪里

线性代数研究的是线性空间的性质,数据通常会被表示为欧式空间中的点,而这些点经过一系列变换后会映射到另一个空间,在新的空间中隐藏在数据中的规律才得以显现。

所以线性代数作为研究空间的一门科学,是入门机器学习的最要基础之一

视频:推荐 MIT 的老教授 Gilbert Strang 的线性代数上课视频。

没学过线代的同学会发现这门课程,讲得清晰而且直观,深入线代的精髓,完全不是那种理论堆砌的讲法,而且老教授幽默风趣,很有人格魅力。

英文不好,也不用担心,字幕是中文的


下载地址(提取码:jack ):
https://pan.baidu.com/s/1WktC95HL2GF0PKa311L5SQ

教材:推荐《线性代数及其应用》,作者是 David C. Lay 。


喜欢看书的朋友,这本书一定不能错过。

这本书详细地介绍了线性代数在几何学、计算机图形学、经济学、概率论、信号与系统、微分方程等领域的应用,给人以直观的认识。

下载地址(提取码:jack ):
https://pan.baidu.com/s/10FtcG4mweUWy810cirGGzg

概率论是研究不确定性的一门科学,生活处处是概率。机器学习算法需要对现实情况建模,自然是少不了将概率论作为工具。

这门课入门并不难,大家可以挑一本评分还可以的书开始学习。

这里推荐陈希儒的《概率论与数理统计》,讲得很详细,如同听一个老者回忆自己的概率与统计心得,相信读者也会有所收获。


下载地址(提取码:jack ):
https://pan.baidu.com/s/1P_jIbbW6JUNSlCaCX7CXKA

如果时间充裕,推荐先学好数学基础。如果时间不够,那就跳过数学基础部分,学算法的时候,哪里不会补哪里。

2、编程能力


编程语言,需要至少掌握两门, Python 和 C++。

工作中,Python 主要用于处理数据算法调研模型训练的工作,而 C++ 则是负责工程落地

算法工程师,需要针对落地场景,对算法的可靠性和实时性等方面进行优化,C++ 工程能力必不可少。

Python 是一门非常友好的编程语言,不但易于入门而且功能强大,在进行机器学习算法开发的过程中会大量使用 Python。

视频:我上学看的第一个视频,就是小甲鱼 Python 课程,风趣幽默,涉及Python 语法基础、网络爬虫、Pygame 飞机大战等内容,内容很丰富。


下载地址(提取码:jack ):
https://pan.baidu.com/s/1-WasSZey8bZuEfp48bTOuw

实战是最好的老师,学习 Python 的时候,可以找一个自己喜欢的方向,去实战。

边实战,边学习。比如写爬虫、做小游戏、玩各种有趣的算法等。

这里面,爬虫是最简单的,很容易有成就感,让你坚持学习下去,下载小说、下载漫画、下载音乐、下载电影、抢票等等小程序。

这个推荐我的一个 Github star 量 11.4k+、fork 4.5k+的爬虫项目。


每个实战,都有对应的文章教程,代码开源

项目地址:
https://pan.baidu.com/s/1-WasSZey8bZuEfp48bTOuw

教材:推荐《流畅的Python》,书看完有些难度,但是哪来当个手册用,很方便,哪些语法忘记了,翻阅一番,必能有所收获。


下载地址(提取码:jack ):
https://pan.baidu.com/s/1-YBEOYY45CYrbM4Zxb21Yw

C++ 是一种面向对象的程序设计语言,无论你是做算法,还是做开发,亦或者是做测开。C++ 都应该掌握,它是一个基础的编程语言。学会了这门编程语言,再学其它,就会更得心应手。

视频:这部分推荐慕课网的免费教程,很好的入门视频,老师讲得绘声绘色、形象生动、通熟易懂。


一共分为 7 章,每章视频的时间是 2-3 个小时,半个月可以轻松刷完,学习顺序是:


  • C++远征之起航篇

  • C++远征之离港篇

  • C++远征之封装篇(上)

  • C++远征之封装篇(下)

  • C++远征之继承篇

  • C++远征之多态篇

  • C++远征之模板篇


视频观看地址(提取码:jack):

https://pan.baidu.com/s/1-YBEOYY45CYrbM4Zxb21Yw

教材:推荐被誉为“圣经”的《C++ Primer》,经典巨著,非常棒的书。


下载地址(提取码:jack):
https://pan.baidu.com/s/1uyW6kg6J0KwA8JYUj7AFFA

编程语言基础学完了,接下来就是数据结构与算法。


数据结构与算法是程序员的内功,每一个工程师的必修课。


数据结构的学法,我推荐是直接看书,一边学习一边刷题,同时进行,这样学的速度快。


就如同书名一样,这是一本像小说一样有趣的算法入门书,非常易懂,强烈推荐。



下载地址(提取码:jack):

https://pan.baidu.com/s/1jQYbWiHM6Z8VaP62alkBoA


可以与这本书一同学习的,就是《剑指Offer》,里面讲解了 66 道+ 常见数据结构题,解析思路,简单易懂。


下载地址(提取码:jack):

https://pan.baidu.com/s/1jQYbWiHM6Z8VaP62alkBoA


两门书一起看,轻松入门数据结构与算法。


不过《剑指Offer》讲解的代码都是 C/C++,没有 Python 版本,想看 Python 版本的,可以看我整理的教程,C++ 和 Python 都有实现和讲解,题目已按照类型划分好。



项目地址:
https://github.com/Jack-Cherish/LeetCode

两本书都看完,题也刷完了,那就算是入门了。


想进阶,进一步学习,直接上 LeetCode。



力扣可以从 HOT 100 或 精选算法 200 题刷起,题目相对于《剑指Offer》要增加一些难度,但每道题目都有对应的解题思路和答案。

坚持刷完 200 道,大多的面试轻松搞定,完全够用。


当然要面试谷歌级别的大佬,Hard 题是不能放过的。


刷题地址:
https://leetcode-cn.com/

Tip:刷一遍题,回头看还会忘,不要怀疑自己,要反复刷,反复练习。

3、算法基础


恭喜大家,在做了前面这么多基础工作之后,终于可以开始入门机器学习算法了。

机器学习

视频:推荐吴恩达老师的机器学习视频,吴恩达是整个领域的巨头之一,学术地位很高。同时,他出的视频也对新手非常友好,入门的不二之选。


下载地址(提取码:jack ):

https://pan.baidu.com/s/1OglLhzB5gWHrK_pkAWF2Sg


教材:还是那句话,光看不练是不行的。《机器学习实战》,理论结合实战,适合新手。


下载地址(提取码:jack):
https://pan.baidu.com/s/1lEz8POdx9V5Xu-RVMlBttA

《机器学习实战》使用 Python2 实现,有些细节讲的不够细致,对此我进行了完善,使用 Python3 复现了一遍,并结合 sklearn 以及更多的好玩例子,进行讲解。


全网阅读量 500w+:



对应的 Github 开源代码 Star 3.3k+,fork 3.1k+。



在线阅读地址:
https://cuijiahua.com/blog/ml/

我也将这个系列打包成了本地 pdf,喜欢离线看,也可以直接下载。

下载地址(提取码:jack):
https://pan.baidu.com/s/11OI0NZ_Fv-ZJBpT8pmjlRw

深度学习


深度学习是现在的算法工程师绕不开的一个子领域,是机器学习的子集。


视频:还是推荐吴恩达老师的深度学习视频,也是对新手非常友好。


下载地址(提取码:jack ):

https://pan.baidu.com/s/1TShDS2_jioxMRhFv2253aQ

教材:说实话,深度学习,我并没有看过书,都是视频+ Github 开源项目学习的,不过被誉为深度学习领域圣经的“花书”,可以备一本。


下载地址(提取码:jack):
https://pan.baidu.com/s/1drDJUf9OqSfxoicsk8J2gg

深度学习框架

深度学习框架有很多,Tensorflow、Pytorch、Paddle、MXNet、Caffe等。


我在工作过程中,用的最多的是 Pytorch,其次是 Tensorflow。


新手上手,推荐先学 Pytorch,可以直接看 Yunjey Choi 大佬的 Github 教程,简单入门:


项目地址:

https://github.com/yunjey/pytorch-tutorial


Pytorch 深度学习框架学习,也可以看我写的 Pytorch 深度学习实战系列教程,有垃圾分类、图像分割等结合实战的小项目。


Github 开源代码 Star 400+,fork 250+。


项目地址:

https://github.com/Jack-Cherish/Deep-Learning


我也将这个系列打包成了本地 pdf,喜欢离线看,也可以直接下载。


下载地址(提取码:jack):

https://pan.baidu.com/s/1PXkcKJa-ZJ0fWeqVduCoZA


4、实战


实战实战,文章反复提到了这么多次,仅仅这些还是远远不够的。


因为更多时候,你是跟着视频 or 文章的思路去实战,这缺少了独立思考的过程。


学了这么多,你并没有独立完成过一个项目,数据怎么处理,怎么分析问题,用什么算法解决问题,也没有独立思考过。


算法工程师的岗位竞争也比较激烈的,为了在茫茫人海中脱颖而出,我们需要以团队个人的形式,独立完成一些项目,只有这样,你才能更具竞争力。


对于学生党,做项目,最简单直接的方法就是参加竞赛


推荐两个参加竞赛的地方,一个是国外的 Kaggle,另一个是国内的阿里云天池


两个竞赛的奖金也都很丰富,根据自己的喜好,参赛即可。


Kaggle:

https://www.kaggle.com/



阿里天池:

https://tianchi.aliyun.com/competition/gameList/activeList



既能打比赛,又能赢奖金,何乐而不为呢?

3


资料打包

本文提到的资料,我都打包了,可以直接全部打包带走。


下载地址(提取码:jack):
https://pan.baidu.com/s/12tbVrUF056pY7aCyMpgl1w

PS:有能力支持正版的,资料觉得不错,可以去购买支持一波正版。

浏览 25
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报