2021年9月快手，社科广告算法面试题分享！-技术圈


文 | 七月在线
编 | 小七

FIGHTING

问题1：l1,l2公式，区别

问题2：二分查找

问题3：翻转数组二分查找

问题4：决策树都用什么指标，信息增益是什么

问题5：auc含义公式


问题1：l1,l2公式，区别
L1/L2的区别
L1是模型各个参数的绝对值之和。
L2是模型各个参数的平方和的开方值。

L1会趋向于产生少量的特征，而其他的特征都是0。
因为最优的参数值很大概率出现在坐标轴上，这样就会导致某一维的权重为0 ，产生稀疏权重矩阵
L2会选择更多的特征，这些特征都会接近于0。
最优的参数值很小概率出现在坐标轴上，因此每一维的参数都不会是0。当最小化||w||时，就会使每一项趋近于0。

L1的作用是为了矩阵稀疏化。假设的是模型的参数取值满足拉普拉斯分布。
L2的作用是为了使模型更平滑，得到更好的泛化能力。假设的是参数是满足高斯分布。


问题2：二分查找  
leetcode704，搜索区间两端闭, while条件带等号，mid要加减1。
代码如下︰

时间复杂度:o(logN)。
空间复杂度︰o(1)。

问题3：翻转数组二分查找
该题为leetcode153题：数组不包含重复元素，并且只要当前的区间长度不为 1，pivot 就不会与 high 重合；而如果当前的区间长度为 1，这说明我们已经可以结束二分查找了。因此不会存在nums [ pivot ] = nums [ high ] 的情况。

当二分查找结束时，我们就得到了最小值所在的位置。

代码如下：



问题4：决策树都用什么指标，信息增益是什么
信息增益，信息增益率，基尼指数

信息增益是以某特征划分数据集前后的熵的差值，熵可以表示样本集合的不确定性，熵越大，样本的不确定性就越大。

 问题5：auc含义公式
AUC是ROC曲线下面的面积，AUC可以解读为从所有正例中随机选取一个样本A，再从所有负例中随机选取一个样本B，分类器将A判为正例的概率比将B判为正例的概率大的可能性。AUC反映的是分类器对样本的排序能力。AUC越大，自然排序能力越好，即分类器将越多的正例排在负例之前。

— 推荐阅读 —

最新大厂面试题

2021年9月字节跳动商业广告，算法岗面试题分享！
2021年9月底，科大讯飞CV岗位面试题分享！
2021年9月10日，京东CV算法岗秋招面试题分享！

AI开源项目论文

精选项目论文：高性能视觉库、文本生成序列模型的有效实现
本周优秀开源项目分享：多对象跟踪、电影推荐系统、神经网络...
【干货】本周AI领域优秀开源项目分享！

NLP ( 自然语言处理 )

Transformer也能生成图像，新型ViTGAN性能比肩基于CNN的GAN
兼具CNN和Transformer优势，灵活使用归纳偏置，Facebook提出ConViT
NLP界新SOTA！吸纳5000万级知识图谱，一举刷爆54个中文任务！

CV（计算机视觉）

项目经理：做过这九个CV项目，工资你说了算！
219个 opencv 常用函数汇总，一个比一个强大！
手残党福音：一键抠图、隔空移物，这篇CVPR华人论文帮你搞定