【算法】我面了N+算法岗候选人,这样的给了SSP

机器学习初学者

共 1939字,需浏览 4分钟

 · 2022-01-23

在前几年我参加秋招的时候,当时几乎所有大厂的ssp,还有几家大厂的人才计划。被好几家cto/svp/技术委员会主席面试过。现在也从被面,成长为面试别人。2022校招我参与筛了近百分份简历,面了N多同学,作为算法从业人员+面试官,就有了不一样的视角


从面试官的角度,给大家讲点面试经验。这是刷面经看不到的东西!


我个人主要是5方面,基础扎实,知识深度,知识广度,业务理解,沟通表达对候选人进行考察。


至于问不问leetcode,放在文章结尾了。



听起来比较玄乎,我们举一个具体的例子。


案例:小A毕业于北京985高校硕士,是在某资讯APP实习过的同学,手里已经有大厂SSP offer了。他简历上写了一个文本分类的项目。由某APP存在图文类目错误,漏添等,使用人工标注数据,构造了Bert的100多类的文本分类模型,建设新闻类目智能化分类能力,通过模型调优,上线准确率85%。


针对基础知识方面,


1.讲下Bert的基本结构?

2.self-attention的公式是啥?

3.Bert 的预训练任务是怎样的?

4.模型的评估指标是啥?

5.模型指标具体的计算细节是啥?


点评:这部分不会问太多,主要是为了确认候选人的在机器学习,深度学习,编程和数据结构等基本知识掌握情况。




针对知识深度方面,


1.Bert之前大家都在用什么方法解决文本分类问题。

2.word2vec了解吗,有什么弊端?BERT相比有什么优势?

3.Bert中为什么要在开头加个[CLS]?有其他代替方法吗?

4.Bert中有哪些地方用到了mask?各有什么作用?

5.Bert中self attention 计算复杂度如何?如何处理过长文本?


点评:这部分也不会刁难候选人问太多,除了考察下知识深度,也为了确认候选人,简历上项目的来龙去脉比较熟悉,对原理的细节比较懂,排除调包,调参侠的可能。




针对知识广度方面,


1.在你这个场景,标注的类别体系是怎么建立的?有什么机器学习方法可以帮助建立分类问题的类别体系吗?

2.标注数据的周期有多长,积累了多少数据?如何评判这些数据模型已经够用了?

3.有什么让标注数据提升人效的方法吗?

4.在你这个场景,遇到了新类别的数据怎么办?有没有办法不重新训练模型,就可以识别新的类目?

5.针对长尾类目,数量过少的问题,你是怎么解决的?除了积累数据,还有别的方法吗?


点评:这部分问的相对较多,除了确认候选人的知识广度,还会看看候选人是不是机械完成任务的工具人,对项目有没有横向的思考,有没有主动多想一步的意愿。




针对业务理解方面,

0.这个模型,有多少场景和流量在用?有什么AB测的过程吗?

1.你这个模型,除了技术上的准确率,在业务上观测什么指标?

2.这个事情的业务价值体现是什么?提升审核效率吗?具体怎么量化?上下游都有哪些关键业务?

这部分不会为难候选人,特别是没有实习过的同学,他们可能不会完整的。


点评:这部分会简单聊一下,主要看候选人在问题拆解,问题解决,技术指标提升,业务指标提升的一个逻辑。有没有在大的视角关注你做的事情。




关于代码题!


如果简历单薄,实在填不满面试时间了,我还会问一道算法题。当然如果你前面很充实,是没有这个环节的。


同一个题目分easy  medium  hard三部分。easy问思路暖场,然后问medium的手撕代码,hard问解题思路。


1.easy  正整数数数组,任取两数x1,x2,求|x1-x2|的最小值。

2.medium  任意两个正整数数组,从中各取一数,分别为x1和x2,求|x1-x2|的最小值。

3.hard  任意N个正整数数组,从中各取一数,分别为x1,x2…xn,求 |x1-x2| + |x2-x3|+ |x3-x4|  +...  +  |xn-1-xn|的最小值。


点评:主要考察候选人的问题解决能力,通过问题拆分,难而化易,举一反三的能力。




关于沟通表达,


主要体现在耐心倾听,准确理解。有逻辑、有条理地表达自己的观点。

有些小技巧:不抢话,回答简洁,准确,有逻辑性。习下新闻上领导发言,第一,第二,第三。或者背景,措施,效果等逻辑角度展开讲解。


前面5个纬度都ok的话,SSP就手了~


往期精彩回顾




浏览 39
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报