3月31日美团春招推荐算法岗面试题分享!

共 2329字,需浏览 5分钟

 ·

2022-04-14 11:13

公众号福利

👉回复【100题】领取《名企AI面试100题》PDF

👉回复【干货资料】领取NLP、CV、ML等AI方向干货资料

👉回复【往期招聘】查看往期内推招聘


abb0ec16bd0fb094fc75137f5f7a73ea.webpabb0ec16bd0fb094fc75137f5f7a73ea.webp

1e4583dd0a3c7d04255c67a4c7f688fa.webp


拉至文末,找小助手进群看公开课~

abb0ec16bd0fb094fc75137f5f7a73ea.webpabb0ec16bd0fb094fc75137f5f7a73ea.webp



8e59ae93490472d00a60909a0107bd38.webp3fa8e29a5437f61ddca551440af41ead.webp8e59ae93490472d00a60909a0107bd38.webp



问题1:为什么分类问题损失不使用MSE而使用交叉熵


1、均方误差作为损失函数,这时所构造出来的损失函数是非凸的,不容易求解,容易得到其局部最优解;而交叉熵的损失函数是凸函数;


2、均方误差作为损失函数,求导后,梯度与sigmoid的导数有关,会导致训练慢;而交叉熵的损失函数求导后,梯度就是一个差值,误差大的话更新的就快,误差小的话就更新的慢点。


037b5c3460a65aea7be4d9b2c6f808ba.webp

 

问题2:BN的作用,除了防止梯度消失这个作用外


(1)加快收敛速度:在深度神经网络中中,如果每层的数据分布都不一样的话,将会导致网络非常难收敛和训练,而如果把 每层的数据都在转换在均值为零,方差为1 的状态下,这样每层数据的分布都是一样的训练会比较容易收敛。


(2)控制梯度爆炸防止梯度消失:以sigmoid函数为例,sigmoid函数使得输出在[0,1]之间,实际上当x道了一定的大小,经过sigmoid函数后输出范围就会变得很小。


(3)BN算法防止过拟合:在网络的训练中,BN的使用使得一个minibatch中所有样本都被关联在了一起,因此网络不会从某一个训练样本中生成确定的结果,即同样一个样本的输出不再仅仅取决于样本的本身,也取决于跟这个样本同属一个batch的其他样本,而每次网络都是随机取batch,这样就会使得整个网络不会朝这一个方向使劲学习。一定程度上避免了过拟合。


037b5c3460a65aea7be4d9b2c6f808ba.webp

 

问题3:训练时出现不收敛的情况怎么办,为什么会出现不收敛


从数据角度:

是否对数据进行了预处理,包括分类标注是否正确,数据是否干净

是否对数据进行了归一化

考虑样本的信息量是否太大,而网络结构是否太简单

考虑标签是否设置正确


从模型角度:

尝试加深网络结构

Learning rate是否合适(太大,会造成不收敛,太小,会造成收敛速度非常慢)

错误初始化网络参数

train loss 不断下降,test loss不断下降,说明网络仍在学习;

train loss 不断下降,test loss趋于不变,说明网络过拟合;

train loss 趋于不变,test loss不断下降,说明数据集100%有问题;

train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数目;

train loss 不断上升,test loss不断上升,说明网络结构设计不当,训练超参数设置不当,数据集经过清洗等问题。


037b5c3460a65aea7be4d9b2c6f808ba.webp


问题4:LR与决策树的区别


1、逻辑回归通常用于分类问题,决策树可回归、可分类。

2、逻辑回归是线性函数,决策树是非线性函数。

3、逻辑回归的表达式很简单,回归系数就确定了模型。决策树的形式就复杂了,叶子节点的范围+取值。两个模型在使用中都有很强的解释性,银行较喜欢。

4、逻辑回归可用于高维稀疏数据场景,比如ctr预估;决策树变量连续最好,类别变量的话,稀疏性不能太高。

5、逻辑回归的核心是sigmoid函数,具有无限可导的优点,常作为神经网络的激活函数。

6、在集成模型中,随机森林、GBDT以决策树为基模型,Boosting算法也可以用逻辑回归作为基模型。


037b5c3460a65aea7be4d9b2c6f808ba.webp

 

问题5:有哪些决策树算法


ID3、C4.5、CART树的算法思想

ID3算法的核心是在决策树的每个节点上应用信息增益准则选择特征,递归地构架决策树。

C4.5算法的核心是在生成过程中用信息增益比来选择特征。

CART树算法的核心是在生成过程用基尼指数来选择特征。

基于决策树的算法有随机森林、GBDT、Xgboost等。


037b5c3460a65aea7be4d9b2c6f808ba.webp

 

问题6:了解哪些行为序列建模方式


参考:https://zhuanlan.zhihu.com/p/138136777


5df8eafc8d6f9be77efaef01af2c7ab8.webp



037b5c3460a65aea7be4d9b2c6f808ba.webp

 

问题7:Leetcode_91题:解码方法


思路:动态规划

class Solution:
def numDecodings(self, s: str) -> int:
n = len(s)
f = [1] + [0] * n
for i in range(1, n + 1):
if s[i - 1] != \'0\':
f[i] += f[i - 1]
if i > 1 and s[i - 2] != \'0\' and int(s[i-2:i]) <= 26:
f[i] += f[i - 2]

return f[n]


037b5c3460a65aea7be4d9b2c6f808ba.webp

 

问题8:智力题:红蓝颜料比例问题


题目描述:两个桶分别装了一样多的红色和蓝色的颜料。先从蓝色桶里舀一杯倒入红色中,搅拌不均匀。再从有蓝色的红色桶中舀一杯倒入蓝色桶里,问两个桶中蓝:红与红:蓝的大小关系?


07b6c6b7fc743473576cc1efe2d3c175.webp


第二步舀的时候,因为不均匀,所以无法知道具体有多少比例的红色和蓝色,可以换一个角度来考虑。因为是用的相同大小的杯子,所以两次操作后,两边的桶里的总体颜色是一样多的。假设红色里面混了一部分蓝色的颜料体积为X升,那么就有X升的红色颜料到了蓝色的桶里,所以两边的比例是一样的。


037b5c3460a65aea7be4d9b2c6f808ba.webp



9、智力题:两个人数数,谁先数到20算谁赢。


要求:每次只能数1或者2个数,采取什么策略可以保证必胜,先手和后手都可以选择。


要想获胜的规律就是要抢到19这个数


因为是两个人参与,所以关键数是19,当数到19时,对方就只能数20了,所以可以反推一下,要想获胜的话,在二十个数里,要想方设法地抢到19,16,13,10,7,4,1这几个公差为3的整数,也就是说在这个游戏里,要想获胜的话,就要抢到1这个数,即谁先数谁就获胜。


deebf86ebf8aae088a63ac71b83e7b42.webp


周四(4月14日)晚8点公开课直播![风险预测:特征工程与树模型实战]

私我回复"414"进直播群


d2e1c503dcdabccdf299f5d061338c4e.webp


浏览 21
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报