送你一份Python算法工程师的打怪升级路线图
在这一年里,我从偏金融数据分析的量化研究员转行成偏大数据挖掘的算法工程师。经过一年的努力,自己终于从一只对机器学习一脸懵懂的小菜鸡成长为一个略知一二的搬砖从业人员了。
在这一年里,我从头开始学习了很多东西,包括:sklearn机器学习,mapreduce和hive,linux基本使用,git和github,xgboost和lightgbm,深度学习课程,tensorflow框架,keras框架 ……
这些内容大部分都做了很系统的笔记,有些已经整理成文章发布在了本公众号上了。此外,本公众号还有一些文章是之前从事量化研究员工作时写的,例如《Python编程ABC》和《Python数据分析》系列的文章。也在本公众号进行了发布。
为了方便大家查找相应的文章,以及对新手学习路线进行指引,我特意整理了公众号一些已经发布了的文章的列表,并作了简单的阅读指南。Enjoy!!!
一,新手入门系列
以下几篇文章适合零基础的新手从头开始学习Python时参考。
为了进一步减少学习难度,我还将其中的《3小时Python入门》在网易云课堂中以视频课程发布了,手把手示范Python编码,搭配食用风味更佳。
二,Python编程ABC
如果你还想继续夯实一下自己的Python基础,那么按照顺序阅读以下《Python编程ABC》系列文章,并完成文章下面的习题,一定会让你的Python代码写的更加顺畅。温馨提示:在公众号对话中回复习题编号可以获得习题参考答案。
三,Python数据分析
俗话说,搬砖才是硬道理。是时候掌握一些实用的搬砖技能了。砖者,数据之谓也,英吉利亚名叫data。仅仅使用Python内置的一些功能徒手搬砖未尝不可,但是学会使用像numpy,pandas,matplotlib之类的搬砖手套,搬砖小拖车,搬砖专用太阳眼镜可以让你的搬砖效率大大提高,减少许多皮肉之苦。
下面的系列文章就是帮助你掌握这些实用的搬砖工具的。依次学习它们并加以勤勉地练习,你应该可以在几个月内成为一名训练有素的搬砖工人了。如果你想从事数据分析相关的工作,推荐搭配学习MySQL和Excel大法。
预热篇 3小时入门numpy,pandas,matplotlib
如果学完以上内容你还觉得不过瘾,想更加深入地学习搬砖的十八般武艺,那么,少年,我看你骨骼精奇,有一本武功秘籍想赠送给你。这本秘籍的名字叫做《Python数据科学手册》。公众号后台回复关键字:搬砖手册,可以获得这本书的电子版。
四,sklearn机器学习
什么?你的搬砖技术已经非常娴熟了,想学点新花样了?少侠果然资质非凡,进展神速。根据个人的经验,6个月左右的学习和实操可以把Python及数据分析的技能掌握得稳如狗了。
好吧,现在可以学习如何用搬来的砖建造些房子了。或许你想从数据中挖掘一些更深刻的价值,例如你想进行垃圾邮件识别,欺诈行为识别,信用风险预测,广告点击预测,个性化商品推荐等等。机器学习这类魔法可以帮助实现你的愿望。《sklearn机器学习》系列的文章会带领你从0到1学习如何使用Python中最流行的机器学习开源库scikit-learn在数据上施展魔法,建造出不同功能的房子。房子,又称模型,英吉利亚名为model。
为了进一步降低学习难度,我也将上述文章做成了视频课程,手把手示范使用sklearn建造房子的基本流程。这套课程目前在网易云课堂是收费的,价格为美丽的68元。相信我,如果你需要从0开始入门机器学习,这套课程会是上上之选。
五,深度学习课程笔记
或许使用sklearn这样的工具训练各种模型对你来说已经是小菜一碟了,你想尝试一些现在机器学习中最具潜力的深度学习技术。利用神经网络,你可以端到端地训练模型从原始数据中蒸馏出相关信息,减少许多人工特征工程步骤,而且效果往往还会有不少的提升。如果熟练掌握了这种技术,你的日常工作会更多地偏向于设计模型架构和调整模型超参数相关的活动,搬砖虽然也是日常必不可少的活动,但是强度总体上会少很多。你或许会觉得自己不完全是一个搬砖工人而更加像一个砌墙工人,听起来是不是有点小激动?
那么,如何掌握这种砌墙的本领呢?目前行业内知名度最高的深度学习入门课程是吴恩达老师的深度学习微专业课程。这个微专业课程确实非常精彩,深度和广度兼备,还配套有适量练习题,对新手也比较友好。但由于课程中理论和数学的成分不少,有些数学较薄弱的同学想从这门课程入门的话,可能还是会比较吃力。
因此我推荐先学习Keras之父弗朗索瓦•肖莱的《Python深度学习》这本书作为第一份深度学习入门的学习材料。全书几乎没有一个数学公式,作者重视帮助读者建立深度学习的思维直觉,以简洁友好的Keras框架为工具展示了许多可供借鉴的范例,面向普通大众读者,真正做到了For Humans。我在阅读此书时,大有如沐春风,茅塞顿开,一气呵成之感,就像吃德芙巧克力一样感到如丝般顺滑。此书应当成为每一个砌墙工人床头必备手册。在本公众号后台回复关键字:砌墙手册,可以获得本书的电子版。
在学完砌墙手册后,你可以再来学习吴恩达老师的课程。但我要提醒你的是,吴恩达老师深度学习微专业系列课程要学的比较明白并不是一件容易的事情,我花费了超过200个小时的时间,你要做好充分的心理准备。如果你已经开始学习了,那么我整理的这份深度学习课程笔记或许对你会有一些帮助。里面提炼了五门课程的知识框架,重新编排了一些内容的顺序,从其它渠道补充了部分相关材料,并融入了我个人的一些理解。
请务必在学完砌墙手册后再尝试阅读这些笔记,并和吴恩达老师的课程同步学习。若直接食用,可能会引起厌学,恐慌,焦虑,愤怒等不良反应。
以上就是送给大家的一份Python算法工程师的打怪升级路线图,后续有更多学习笔记和资源干货,也会不断补充进来。