进百度了 | 菜鸟的数据分析求职之路
↑ 关注 + 星标 ,每天学Python新技能
后台回复【大礼包】送你Python自学大礼包
文中的我,均是指原作者沉鱼!
大家好,我是沉鱼🐟
这是我第一次在公开平台上输出自己的求职历程与心得体会。一是希望能帮助到大家,二是当作对自己过往的总结,更好地调整状态应对新的生活。
一、个人经历介绍
我的个人背景:20届本科毕业生,计算机相关专业,就读于帝都某985工科院校。大三之前基本上对自己的职业生涯没有什么概念,也处于一种混日子的状态。直到大三上的一门统计分析模型的课程,点燃了我对数据分析的热情,梦想成为一名数据科学家。。。。。了解到毕业后可以去互联网做数据分析师,于是兴冲冲地在专业课与出国考试的夹杂下,开始了数据分析零基础的学习。
我的数据分析求职时间线:19年3-8月,知识技能学习 - 19年9月第一份小厂数分实习 - 19年10月第二份中厂数分实习-20年春节疫情爆发,呆在家里准备春招-20年4月收获2家大厂,2家小厂数分offer。
由于大一大二缺少规划,大三大四同时准备出国与校招,导致我真的快累死,一度崩溃。。。但是最终还是在20年疫情下的春招拿到了满意的offer。由此可见,众多营销号所贩卖的“春招无offer”的焦虑口号并不属实,大家也不要太过焦虑,当然提早规划更好。
二、对互联网数分岗的理解
数据分析其实是一个定位很杂的岗位,不同公司不同部门,数据分析师负责的内容均不相同,总的来说可以分为两个大类、四个小类:
(1)技术型数据分析:偏数据开发/偏数据建模
偏数据开发的数据分析师的技能栈其实就是数据开发那一套,只是title是数据分析而已。偏数据建模的那一套,就是利用一些模型、算法来建立预测模型等对业务具有指导作用的数据模型。上述两种都需要比较好的计算机功底,会考许多数据结构与算法的知识,之后的路线也完全是技术路线。
我自己有一定的计算机功底+算法功底,但是现在及以后,并不打算将技术岗作为自己的求职目标,原因有:一、我自己性格比较活分,爱和人沟通,有比较多的鬼点子,让我老老实实每天写代码可能会疯掉 二、自认为在技术方面并没有什么天分与热爱,都是靠苦工与被逼学会的知识,在计算机这个更迭很快的领域,可能很快就会跟不上脚步 三、爱惜自己的头发。。。。
因此,综合考虑,我当时决定找偏业务型的数据分析岗
(2)业务型数据分析:偏业务支持/商业分析
偏业务支持型的数据分析师主要是支持某个业务部门的业务开展,实际工作内容可能会包括:指标体系搭建、看板搭建、数据监控、效果评估等等。这类职业的核心竞争力就是在长期与业务部门的对接合作当中,积累自己对该业务的数据熟悉度与敏感度,积累一些业务sense。但是这类数据分析师特别容易沦为SQL取数机器…针对业务方所设置的策略,数据分析师需要提供大量的数据支持,可能留给自己思考策略的时间并不多,大量的时间耗费在了和业务方讨论数据需求以及动手取数中。而且因为不实际在业务前线,而是通过长期的合作中得到业务方消化思考过的“二手知识”,缺乏从一手知识到实践积累复盘的闭环,所以一不小心就会变成一枚人肉提数机………
而商业分析师则有点类似咨询,主要通过解读经济趋势、政策导向、复盘全盘数据、洞察竞争对手玩法,从而得出未来大方向上的业务开展思路与打法建议。这类岗位前景算是比较好的,视野很开阔,也不容易沦为取数机器…但是老实讲我觉得并不适合应届生去干,具体想法在这里就不多说了。
总而言之,偏业务的数据分析师相对入门门槛会比较低一点,也比较符合我的个性~
三、如何从零开始准备数分求职
抱着“遇事不决,查经验贴”的想法,我当时翻查了很多网络上的课程和知乎上的经验贴。当时是2019年,关于数据分析的经验贴还不如现在这么多,质量也不如现在的文章。所以我当时在知乎上并没有得到合适的的答案与方向。如果是现在看到这篇文章的同学,我倒是建议你可以去大量检索知乎上的相关话题、回答、文章,然后针对自己不懂的问题,做一个简单的数据统计分析,避免陷入一家之谈~
那么现在,有了这么多经验贴的情况下,我还能跟大家聊点什么呢?我想主要是以下两点:
(1)关于数分的书籍和资源推荐多如牛毛,我会帮大家筛选吐槽一批资料,从而帮助你更好的认识到一些“残酷的真相”
(2)关于求职路径到底要如何规划?心态如何调整?我也有一些话想说
3.1 数分资料吐槽与推荐
3.1.1 SQL
对于这个数据分析师安身立命的看家本事,我想许多人已经耳熟能详了。首先,我先讲讲我自己SQL能力是如何精进的,以及目前大厂对数分的SQL能力的要求。
我自己的SQL能力精进主要分为4个阶段:一、菜鸟期,选修了学校的MySQL选修课,以为SQL不过如此,也就是select where group by....二、第一份小公司实习,面试的时候凭借着自己的小聪明答对了SQL题,进去实习以后,通过看别人的SQL代码,增长了不少知识(原来SQL可以写到上百行、原来JOIN可以这么用、原来还有explode lateral view这种写法、原来窗口函数有这么多妙用……)三、练熟了SQL以后,去到了第二份中厂实习,这份实习带我的人要求很高,要求我从零开始写自己的SQL,不可以参考别人的。这段时间我从熟悉底表、自己写SQL、疯狂报错查错的时间,是我对SQL能力掌握的增长期,到这里,加上在学校的时间和工作后的锻炼,我差不多写了3个月的SQL,才算是得心应手了起来。四、搭配业务思维与高速取数,很多时候业务方提来的需求需要被详细解读、沟通后,再着手开始写代码,而不是一上来就类似解题一样,“一顿操作猛如虎,最后结果二百五”
目前各大厂对数据分析师SQL能力的要求普遍是在3阶段,需要手写复杂逻辑,熟练掌握较为高阶用法的。
【吐槽时刻】
不知道多少回答推荐的SQL入门书籍只有一本《SQL必知必会》,在这里我想说,这本书里的内容用一张A4纸就可以总结完,都是SQL最基础的语法,掌握这本书的内容是远远不够的。
除此之外,在练习方面,有许多答主推荐SQL的leetcode来进行刷题,我个人也不太推荐这种“为了写SQL而写SQL”的刷题网站,缺乏业务场景的SQL练习失去了灵魂………
【推荐时刻】
推荐大家阅读 这本书,采用对比的方式同时讲解Excel与SQL,同时get两个技能。同时许多SQL问题都是基于实际业务场景的,突出一个香!
最后要说一句,真正的SQL能力提升,还是要在实战中不断磨练的。所以,以最快的速度加入一份数据分析的实习,是SQL能力提升的最好方式~
3.1.2 Python
Python能够处理较大数据量的数据,同时还有各个现成算法包,可谓是数据分析师的一把利器。应用场景:业务方甩过来一个千万行的数据,Excel与SQL处理都将会很慢,这个时候Python就派上了用场。
先讲讲我自己是怎么提升Python水平的吧。我于2019年3月选修了学校的Python课程,熟悉了Python的基本语法。在此之后,我从网上找了不少Python数据分析的现成项目,练习了Pandas、numpy、matplotlib、sklearn等经典包的用法(大概花了2个月),之后就是漫长而繁忙的实习了。其实实习+全职的过程中,用到Python的地方也不多,面试也很少会问到Python的具体问题,但是一旦用到的时候,那就是一把利器了!建议大家有时间的话尽早掌握这门语言~
【吐槽时刻】
记得之前搜索过,许多答主推荐国外的Python课程,我也去听了。但是真心表示,诸多国外网红Python课如密歇根大学的那个,学习效率真的有点低…当然,这可能是个人学习偏好的原因。所以,如果你也需要一些短平快、没有什么花里胡哨的好课和资料推荐的话,我要开始了!
【推荐时刻】
本书主要介绍了Python基本的语法,主编为北京理工大学的Python网红老师嵩天~搭配嵩天老师的慕课课程,系统学习效果更佳!由于符合中国人一贯的思维方式与学习习惯,我觉得用嵩天的老师的课程入门Python真的十分简洁高效!
这本书主要是Pandas的字典书!如果说什么包在数分手里最常用的话,那一定是Pandas~手头拿着一本Pandas的字典书,随翻随看用法~
《谁说菜鸟不会数据分析》Python篇,简直是入门Pandas最友好的书籍没有之一…甚至菜鸟数据分析的全系列我都推荐大家购买,真的十分简洁易懂,丝毫不用耗费脑细胞~
3.1.3 统计学知识
数据分析师工作场景中需要统计学知识最多的就是各类实验效果的评估了~AB测试问题也算是面试中的高频问题了。
主要会考察候选人的统计学基础知识功底+AB测试相关知识。
【推荐时刻】
这本书比许多国内大学的统计学教材都要更加实用,每个统计学概念都会搭配许多经济学中的案例来讲解,十分有利于读者理解许多统计学概念~建议重点阅读里面的统计推断相关章节
上述两本书为国内和国外仅有的基本abtest实操书籍了,内容十分细致,值得好好研读!
加餐时刻!这本书虽然比较冷门,但是也确实是一本宝藏书籍了!介绍了许多数据科学中实用的统计学概念~感兴趣的同学可以买来看看,有许多小知识搭配论文还是很能给人惊喜感的~
3.1.4 业务分析思维
数据分析师面试中还经常会被问到的问题是关于分析思维的:
“某日DAU/留存率/……突然出现了下降,要怎么分析?”
“如何从0-1搭建一个渠道质量评估的指标体系?”
这类问题实际上最好的学习方法是找一份相关的实习,从实际工作中,你可以从公司现有文档及前辈同事的讲解中,学到许多宝贵的分析思路,最终,慢慢沉淀出自己的分析思路
但是,许多0经验的同学也会在面试中一视同仁地被问到,因此,我推荐大家可以多去知乎、微信公众号上面搜一搜。近两年不少成熟的数据分析师踊跃地在知乎和微信公众号上分享了很多干货,努力搜的话一定能找到不少相关的文章。通过对这些文章里的思路的总结汇总,面试中也能回答个八九不离十了(因为0经验的同学不会要求太高)
在这里,由于业务场景实在是太多了,基于不同业务场景下的数据分析思路其实需要基于具体业务来设计,因此我就不在这里推荐相关书籍了。感兴趣的同学可以私信我~比如用户增长、电商、广告等方向的公司,具体指标的分析方法都会有其常用的套路。
因此,在这里,我还推荐大家,不要局限于看一些数据分析类的书,任何与你所面试公司业务有关的书籍、文章等都值得一读。试着去了解一个业务,自然而言会有一些分析思路的总结~
3.1.5 机器学习算法
虽然说数据分析师在实际业务场景中使用机器学习算法也不多,但是作为数据科学领域一个强有力的探索数据规律的工具,还是建议大家多掌握一些知识,以备不时之需。算法这块在许多面试中也可能会被问到:
“Kmeans算法的原理是什么?”
“XGboost与随机森林的区别是什么?”
以此来考察候选人的机器学习算法功底,关于机器学习算法的书籍在知乎上已经有很多人推荐了,在这里我就不推荐了。经典书籍:西瓜书、李航统计学习方法等都值得好好研读。
这块唯一需要注意的是:不要贪多,仔细啃完一两本经典书籍,基本上就够用了。也不需要太过执拗于数学原理(虽然我本人曾经一度沉迷于数学原理的推导和手写算法),但是后来觉得,不需要也没有必要重复造轮子。sklearn已经有很多现成的包了,作为算法应用层的数据分析师,其实只要学会大概的原理+现成包的使用就可以了~
3.1.6 其他方面知识
其实熟练掌握以上五点,已经足够应对绝大部分数据分析师的面试了。当然,有些岗位还会特别强调,候选人需要会使用tableau等数据可视化软件。关于这类软件的介绍书籍有很多,在这里就不多赘述了。
四、写在最后
文章到这里,已经是接近尾声了。作为第一次输出经验贴的我,还是有点小小的紧张和惶恐的。希望看到这里的铁子们,可以多多点赞支持!!!你们的支持是我下次创作的动力!!!
最后我想唠叨一下,希望大家能够比较冷静、理想地去看待和了解数据分析师这个岗位。它有存在的价值,也有一定的职业壁垒,但是并不像营销号口中说的那么“高大上”和“性感”。因此不必对其抱有过高的预期,而导致在工作中整天干一些脏活累活而感到落差很大~
在求职过程中,不必太过在意公司title。我认为,只要你觉得这个公司有你想学习/感兴趣的东西,都可以考虑去。不必在心中对公司划成三六九等~大公司有大公司的优势,小公司也有小公司的优势~如果你是从零开始的同学,很难第一份工作就找到大厂,从小厂开始,慢慢学习积累,也不失为一条很舒服的路子。
最后,铁子们,如有意见,请不要喷我。欢迎在评论区或私信与我产生友情讨论~
一日一书
《阿里云天池大赛赛题解析——深度学习篇》本书聚焦深度学习算法建模及相关技术,选取医疗、视频、工业三个非常有行业代表性的赛题:瑞金医院MMC人工智能辅助构建知识图谱、阿里巴巴优酷视频增强和超分辨率挑战赛、布匹疵点智能识别,介绍赛题涉及的技术知识和选手的创新思路与模型,对赛题的解决方案从0到1层层拆解。
这本书从经典行业案例出发,内容由浅入深、层层递进,既可以作为专业开发者用书,也可以作为参赛选手的实战手册。
- END -
推荐阅读
推荐一个公众号,帮助程序员自学与成长
觉得还不错就给我一个小小的鼓励吧!