【算法】我面了N+算法岗候选人,这样的给了SSP
共 1939字,需浏览 4分钟
·
2022-01-23 18:53
在前几年我参加秋招的时候,当时几乎所有大厂的ssp,还有几家大厂的人才计划。被好几家cto/svp/技术委员会主席面试过。现在也从被面,成长为面试别人。2022校招我参与筛了近百分份简历,面了N多同学,作为算法从业人员+面试官,就有了不一样的视角。
从面试官的角度,给大家讲点面试经验。这是刷面经看不到的东西!
我个人主要是5方面,基础扎实,知识深度,知识广度,业务理解,沟通表达对候选人进行考察。
至于问不问leetcode,放在文章结尾了。
听起来比较玄乎,我们举一个具体的例子。
案例:小A毕业于北京985高校硕士,是在某资讯APP实习过的同学,手里已经有大厂SSP offer了。他简历上写了一个文本分类的项目。由某APP存在图文类目错误,漏添等,使用人工标注数据,构造了Bert的100多类的文本分类模型,建设新闻类目智能化分类能力,通过模型调优,上线准确率85%。
针对基础知识方面,
1.讲下Bert的基本结构?
2.self-attention的公式是啥?
3.Bert 的预训练任务是怎样的?
4.模型的评估指标是啥?
5.模型指标具体的计算细节是啥?
点评:这部分不会问太多,主要是为了确认候选人的在机器学习,深度学习,编程和数据结构等基本知识掌握情况。
针对知识深度方面,
1.Bert之前大家都在用什么方法解决文本分类问题。
2.word2vec了解吗,有什么弊端?BERT相比有什么优势?
3.Bert中为什么要在开头加个[CLS]?有其他代替方法吗?
4.Bert中有哪些地方用到了mask?各有什么作用?
5.Bert中self attention 计算复杂度如何?如何处理过长文本?
点评:这部分也不会刁难候选人问太多,除了考察下知识深度,也为了确认候选人,简历上项目的来龙去脉比较熟悉,对原理的细节比较懂,排除调包,调参侠的可能。
针对知识广度方面,
1.在你这个场景,标注的类别体系是怎么建立的?有什么机器学习方法可以帮助建立分类问题的类别体系吗?
2.标注数据的周期有多长,积累了多少数据?如何评判这些数据模型已经够用了?
3.有什么让标注数据提升人效的方法吗?
4.在你这个场景,遇到了新类别的数据怎么办?有没有办法不重新训练模型,就可以识别新的类目?
5.针对长尾类目,数量过少的问题,你是怎么解决的?除了积累数据,还有别的方法吗?
点评:这部分问的相对较多,除了确认候选人的知识广度,还会看看候选人是不是机械完成任务的工具人,对项目有没有横向的思考,有没有主动多想一步的意愿。
针对业务理解方面,
0.这个模型,有多少场景和流量在用?有什么AB测的过程吗?
1.你这个模型,除了技术上的准确率,在业务上观测什么指标?
2.这个事情的业务价值体现是什么?提升审核效率吗?具体怎么量化?上下游都有哪些关键业务?
这部分不会为难候选人,特别是没有实习过的同学,他们可能不会完整的。
点评:这部分会简单聊一下,主要看候选人在问题拆解,问题解决,技术指标提升,业务指标提升的一个逻辑。有没有在大的视角关注你做的事情。
关于代码题!
如果简历单薄,实在填不满面试时间了,我还会问一道算法题。当然如果你前面很充实,是没有这个环节的。
同一个题目分easy medium hard三部分。easy问思路暖场,然后问medium的手撕代码,hard问解题思路。
1.easy 正整数数数组,任取两数x1,x2,求|x1-x2|的最小值。
2.medium 任意两个正整数数组,从中各取一数,分别为x1和x2,求|x1-x2|的最小值。
3.hard 任意N个正整数数组,从中各取一数,分别为x1,x2…xn,求 |x1-x2| + |x2-x3|+ |x3-x4| +... + |xn-1-xn|的最小值。
点评:主要考察候选人的问题解决能力,通过问题拆分,难而化易,举一反三的能力。
关于沟通表达,
主要体现在耐心倾听,准确理解。有逻辑、有条理地表达自己的观点。
有些小技巧:不抢话,回答简洁,准确,有逻辑性。学习下新闻上领导发言,第一,第二,第三。或者背景,措施,效果等逻辑角度展开讲解。
前面5个纬度都ok的话,SSP就手了~
往期精彩回顾
适合初学者入门人工智能的路线及资料下载 中国大学慕课《机器学习》(黄海广主讲) 机器学习及深度学习笔记等资料打印 机器学习在线手册 深度学习笔记专辑 《统计学习方法》的代码复现专辑 AI基础下载 本站qq群955171419,加入微信群请扫码: