【算法】我面了N+算法岗候选人，这样的给了SSP-技术圈

在前几年我参加秋招的时候，当时几乎所有大厂的ssp，还有几家大厂的人才计划。被好几家cto/svp/技术委员会主席面试过。现在也从被面，成长为面试别人。2022校招我参与筛了近百分份简历，面了N多同学，作为算法从业人员+面试官，就有了不一样的视角。

从面试官的角度，给大家讲点面试经验。这是刷面经看不到的东西！

我个人主要是5方面，基础扎实，知识深度，知识广度，业务理解，沟通表达对候选人进行考察。

至于问不问leetcode，放在文章结尾了。

听起来比较玄乎，我们举一个具体的例子。

案例：小A毕业于北京985高校硕士，是在某资讯APP实习过的同学，手里已经有大厂SSP offer了。他简历上写了一个文本分类的项目。由某APP存在图文类目错误，漏添等，使用人工标注数据，构造了Bert的100多类的文本分类模型，建设新闻类目智能化分类能力，通过模型调优，上线准确率85%。

针对基础知识方面，

1.讲下Bert的基本结构？

2.self-attention的公式是啥？

3.Bert 的预训练任务是怎样的？

4.模型的评估指标是啥？

5.模型指标具体的计算细节是啥？

点评：这部分不会问太多，主要是为了确认候选人的在机器学习，深度学习，编程和数据结构等基本知识掌握情况。

针对知识深度方面，

1.Bert之前大家都在用什么方法解决文本分类问题。

2.word2vec了解吗，有什么弊端？BERT相比有什么优势？

3.Bert中为什么要在开头加个[CLS]?有其他代替方法吗？

4.Bert中有哪些地方用到了mask?各有什么作用？

5.Bert中self attention 计算复杂度如何？如何处理过长文本？

点评：这部分也不会刁难候选人问太多，除了考察下知识深度，也为了确认候选人，简历上项目的来龙去脉比较熟悉，对原理的细节比较懂，排除调包，调参侠的可能。

针对知识广度方面，

1.在你这个场景，标注的类别体系是怎么建立的？有什么机器学习方法可以帮助建立分类问题的类别体系吗？

2.标注数据的周期有多长，积累了多少数据？如何评判这些数据模型已经够用了？

3.有什么让标注数据提升人效的方法吗？

4.在你这个场景，遇到了新类别的数据怎么办？有没有办法不重新训练模型，就可以识别新的类目？

5.针对长尾类目，数量过少的问题，你是怎么解决的？除了积累数据，还有别的方法吗？

点评：这部分问的相对较多，除了确认候选人的知识广度，还会看看候选人是不是机械完成任务的工具人，对项目有没有横向的思考，有没有主动多想一步的意愿。

针对业务理解方面，

0.这个模型，有多少场景和流量在用？有什么AB测的过程吗？

1.你这个模型，除了技术上的准确率，在业务上观测什么指标？

2.这个事情的业务价值体现是什么？提升审核效率吗？具体怎么量化？上下游都有哪些关键业务？

这部分不会为难候选人，特别是没有实习过的同学，他们可能不会完整的。

点评：这部分会简单聊一下，主要看候选人在问题拆解，问题解决，技术指标提升，业务指标提升的一个逻辑。有没有在大的视角关注你做的事情。

关于代码题！

如果简历单薄，实在填不满面试时间了，我还会问一道算法题。当然如果你前面很充实，是没有这个环节的。

同一个题目分easy medium hard三部分。easy问思路暖场，然后问medium的手撕代码，hard问解题思路。

1.easy 正整数数数组，任取两数x1,x2，求|x1-x2|的最小值。

2.medium 任意两个正整数数组，从中各取一数，分别为x1和x2，求|x1-x2|的最小值。

3.hard 任意N个正整数数组，从中各取一数，分别为x1,x2…xn，求 |x1-x2| + |x2-x3|+ |x3-x4| +... + |xn-1-xn|的最小值。

点评：主要考察候选人的问题解决能力，通过问题拆分，难而化易，举一反三的能力。

关于沟通表达，

主要体现在耐心倾听，准确理解。有逻辑、有条理地表达自己的观点。

有些小技巧：不抢话，回答简洁，准确，有逻辑性。学习下新闻上领导发言，第一，第二，第三。或者背景，措施，效果等逻辑角度展开讲解。

前面5个纬度都ok的话，SSP就手了～


往期精彩回顾




适合初学者入门人工智能的路线及资料下载
中国大学慕课《机器学习》（黄海广主讲）
机器学习及深度学习笔记等资料打印
机器学习在线手册
深度学习笔记专辑
《统计学习方法》的代码复现专辑
AI基础下载
本站qq群955171419，加入微信群请扫码：