干货面经 | 初中级爬虫工程师面试指北 - 毕业工作一年薪资翻番了
共 1759字,需浏览 4分钟
·
2021-06-26 01:35
前言
大家好,我是煌金,很久没有写技术文了,主要是没有代表性的网站,比较简单的网站写了也没有什么干货,所以索性不给大家制造信息噪音了。
有 我好友的读者,应该会看到朋友圈发的一份喜报,是一位读者告诉我,他通过学习喜提爬虫新 offer,毕业一年成功实现薪资翻涨了 3 倍。
他找工作的时候就找我聊了一次,我当时也和他沟通,希望他能在面试结束的时候整理一份面经,我发到公众号上,所以面经来了。
以下为读者第一人称
正文
大家好,我是 Ledbetter ,我是去年毕业出来深圳工作的,到现在也有一年两个月的时间了。
在刚毕业那会可以说是什么都不会,爬虫对于我来说都只是一个陌生的词汇,不过后来,我在书上接触到了爬虫这个词汇,刚开始只是觉得有趣
后面的日子里,我开始自学爬虫,那时候也不知道爬虫的方向是什么,更不用说逆向了,只会简单的请求网页、处理数据,便去面试了很多家公司。
才发现,他们要的是我远远没有掌握的,就这样我被拒绝了一次又一次。
后来我渐渐地心灰意冷了,不知道接下来学习的方向
机缘巧合关注到鱼哥的公众号,看到了鱼哥的文章
突然发现原来爬虫还能这么玩
在那之后,我一直研究鱼哥的逆向文章,每一篇都自己实现出来,虽然都是简单的 js 逆向,但是我那时候觉得自己可以了,所以我又去面试了。
但是只会一些简单的逆向,还是没用,现在大部分公司都需要能够处理复杂的 js 逆向并且熟练的掌握数据处理、存储、简单的 app 逆向、分布式等技能。
那个时候感觉爬虫好难啊
不过还好,最后还是通过了公司的面试
在面试的过程中我记录了一些遇到的面试题,这里给大家列举了一下,希望对大家之后找工作有帮助:
1、对于多进程,多线程,多协程之间你是怎么理解的,一般在什么场景使用它们?
2、对于分布式爬虫,有做过吗,一天最大爬取量是多少?
3、做爬虫一般用哪种数据库,可以说说为什么要用这种数据库吗,以及它和其他数据库的区别?
4、ip 代理池,你是怎么搭建的?
5、遇到账号封禁,你是怎么解决的?
6、说说你是怎么解决验证码这一块的逆向,思路,还有具体一点的步骤。
7、对于 app 抓包你是怎么处理的?
8、你平常是怎么抓包的?
9、字体反爬你是怎么处理的?
10、做过 x x 的验证码吗?
11、处理爬虫这一块的数据,你是怎么处理的,例如数据的重复性,异常值。
12、对于风控,你是怎么处理的?
13、平常自己做过算法类的模型吗?
14、说说你做过项目中你认为最难的地方。
15、说说你遇到过最有成就感的逆向。
16、在反爬过程中,一般你遇到解决不了的问题,你会通过什么方式解决?
17、还有一些就是关于你爬虫用的那些框架的知识了。例如:scrapy的中间件,你是怎么使用的……
以上这些是我面试了 10 多家技术面试官问的一些问题,至关重要~
虽然有一些问题对于招聘上的薪资属于超纲的要求,不过也间接反应了目前招聘的大致方向。
以下是我这段时间找工作的一些思考:
1、尽量丰满自己的简历。不是指简历造假,而是尽量在简历中体现自己做过的项目且对这些项目中涉及的技术点烂熟于胸。
2、面试中不会的知识点,或者代码题不会的不要说不会,要给出自己的思考。
“我是煌金,这是我的建议
可以把思路抛出来,可以以讨论的心态和面试官聊聊,即使失败了也学了一手
3、掌握逆向的知识,不管是 js 逆向或 app 逆向知识。上面遇到的很多问题像验证码和抓包问题,如果答得好是比较加分的,如果在项目里有涉及相关的知识点,也可以着重说一说。
掌握了上面问题的大部分,加上你有一个对爬虫的热爱和钻研的精神,找工作其实还是蛮简单的~
一年前我刚出来那会工资是 4500 的,税后 4000 都不到,现在已经到 1w + 了,虽然不多。
我觉得得到一个系统性的学习真的很有必要,所以可以多多找大佬们聊一聊,找找方向。
鱼哥技术群里的大佬,各个都是人才说话又好听,我超喜欢这里的。
祝各位在面试的过程中,offer 满满~
对了,看完记得一键四连,这个对我真的很重要。