NLP面试复盘 | 阿里/腾讯/头条/paypal/快手
DayNightStudy
共 2373字,需浏览 5分钟
· 2021-09-30
作者 | ray-95
整理 | NewBeeNLP
周末愉快!来看几篇面筋涨涨经验~
写在前面
本人学渣一枚,春招实习有幸过了几家大厂,在此期间得到了很多帮助,也特意分享一下自己的经验,希望能帮助到有需要的人。
阿里
阿里的面试周期最长,最初2月份参加预面试,到正式面试到收offer,经历了2个月。
一面:1h
面试讲项目 项目中为什么使用lightGBM,比起xgboost的优点是什么 因果词向量的应用场景 tf多个变量如何共享权重 SGD min-SGD的区别 对epcho做shuffle,类似于哪一种优化器 介绍一下优化器 什么情况下不适用动量优化器 WGAN,要保证梯度平滑,使动量优化器容易过拟合,防止梯度突变 介绍一下生成任务的做法 用auto-regression的模型 beam-search,如何在做生成任务的时候,生成多个结果并且保证结果的多样性 非自回归的模型如何一次性生成整个句子 做后序遍历,判断一个数组是否满足后序遍历 机器翻译的最新论文
二面:1h
部门leader面,主要问项目,项目难点在哪里
介绍attention 和self.attention区别 算法题目: 给定x种硬币,凑齐y元 给2种硬币,非均匀,计算正反面的概率,随机选1枚,抛100次,重复1000次,如何计算2种硬币的概率
阿里3面(交叉面)
只能只用两个api :getcolour O(1) --获取指定位置的颜色 Swap:ij 交换位置 lr模型的输入和输出分别是什么 lr对商品进行点击进行概率预测,输入需要做一些什么处理 Lr---对商品,估计商品点击的概率--预测 什么情况下需要将连续特征离散化--- One-hot lr按照分布需要将特征如何进行离散化 树模型如何处理离散型特征 lr模型---根据做特征交叉,为什么 lr中如何缓解过拟合 减轻特征工程的手段,--如何构建更多的特征 coding题目:黑盒子,n是3的倍数个球,3种颜色,n个球排成一排,乱序 rgb
腾讯微信
一面挂
学习率/优化器(adam)/bach-normalzation/➕res+learn-rate 一种可行的方案是用拒绝推断 一种方案是用smote 自我介绍+询问简历内容 词向量的方法 正负样本不均衡的问题,如何解决 介绍bert;bert如何使用transformer的encoding模块-bert的输入和transformer有什么不同 bert有什么缺点 XGboost和GBDT xgboost做树的分类的时候是怎么做的-- 做过哪些nlp深度学习的任务 深度学习模型在训练过程中如何加速收敛 防止过拟合 mse和交叉熵的区别----为什么用交叉熵 一对父母,已知一个人是男孩,另一个人是男孩的概率 给100亿个数据,怎么找到中位数
腾讯PCG
pgc一面:(30min)
主要聊项目
pcg二面:
模型学习中,正负样本的训练方式不同有什么影响 引入词向量的相似性对于结果有什么不好的影响 面试题目:给两个球,求解最坏情况下走多少步(采用贪心的思想)
pcg3面:(交叉面)
主要问项目 相似性匹配的常用算法 bert
头条
算法岗挂,后来大数据岗通过面试,主要在这边记录算法岗的面试经验
一面
问了bert ,transformer 用梯度下降的思路求开根号 写交叉熵公式 防止过拟合的方法 transformer的中的attention机制,其中self-attention和encoder-decoder attention之间的关系 最小二乘法的推导公式,最小二乘究竟是什么,和极大似然的关系 在词向量中很稀疏和出现未登录词,如何处理 线性和非线性存在什么关系之间的关系 logistic和svm之间的区别---svm自带正则化 依存句法如何实现---涉及crf-序列标注
快手
nlp和风控工程师
一面
问项目,着重问了第一个项目 然后两道算法题,bugfree 问了batch-normalization和layer-normalization的区别,然后问在inference线上模型如何处理 FNN-中有没有隐层 inference-batch-nor---针对一条输入
二面
position位置,信息 transformer为什么用+不用concat Drop-- 实现方式上是否会有差别----train 和test上有什么区别 train会有一定概率抛弃,test会保留全部,train会除以概率 dropout 和L1 和l2是什么关系,有什么异同 做题--两种方法实现
paypal
数据科学家岗位
一面二面同时:
项目+场景题 如何防止过拟合,dropout为什么可以防止过拟合 sql的题目 具体问项目,问具体的实现策略
三面
acc recall f1 变量与target相关性的描述 特征组合 特征重要性判断 模型好坏的评估 分数映射是否符合正态分布
一起交流
想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定要备注信息才能通过)
- END -
2021-09-10
2021-09-07
2021-09-06
评论
我看阿里的年终奖总算发了!
到4月底了,这两天看朋友圈,发现阿里的年终奖终于发了,问了问老同学,也从网上检索了不少信息,基本搞清楚了阿里今年的年终奖情况。近来来阿里一些集团对绩效等级做了较大的调整,以前的旧绩效系统中,绩效分为3.25、3.5、3.75、4和5五个等级,其中4和5是较高绩效等级,较少见。而且之前3.5绩效内部划
公子龙
0
阿里的同事,写的代码真 TMD 优雅!
通过这篇文章你将了解到整洁的代码对项目、公司和你的重要性,以及如何书写整洁的代码.通过命名、类、函数、测试这四个章节,使我们的代码变得整洁.1、为什么要保持代码整洁?不整洁的代码随着时间的增加而增加时,生产力会随之降低.导致的结果就是:代码不易扩展或扩展容易引发其他问题程序崩溃加班增加公司成本(加人
Java专栏
1
5000w+ 的大表如何拆?亿级别大表拆分实战复盘
前言笔者是在两年前接手公司的财务系统的开发和维护工作。在系统移交的初期,笔者和团队就发现,系统内有一张5000W+的大表。跟踪代码发现,该表是用于存储资金流水的表格,关联着众多功能点,同时也有众多的下游系统在使用这张表的数据。进一步的观察发现,这张表还在以每月600W+的数据持续增长,也就是说,不超
码农编程进阶笔记
0
阿里公布年终奖,P7, 3.5+,22W年终奖,还有35W长期现金激励,真香
上一篇:网友发问:事业编一年6万,干35年退休挣200万,程序员一年60万,5年就挣300万,事业编再爽能有程序员干五年退休爽?阿里这几天开始员工绩效和年终奖沟通了,又是几家欢喜几家愁的时候。自2024年4月1日起,公司对其股权激励计划进行了更新。除了继续提供一次性的年终奖和股权激励之外,阿里巴巴还
开发者全社区
0
热搜第一,腾讯又一游戏停运了!
腾讯又有一款游戏要停运了。最近,腾讯游戏宣布:由于游戏的代理协议即将到期,《食物语》将于2024年6月18日11:00停止在中国大陆地区的运营。并且这次的停运话题一度冲上热搜榜第一位,引发网友热议。据了解,《食物语》是一款中华美食拟人的国风女性向RPG养成手游,于2019年9月份公开测试,运营至今已
逆锋起笔
0
多人同时导出 Excel 干崩服务器!新来的阿里大佬给出的解决方案太优雅了!
点击关注公众号,Java 干货及时推送↓推荐阅读:面试辅导,我们出大成果了!来源:juejin.cn/post/7259249904777838629前言 业务诉求:考虑到数据库数据日渐增多,导出会有全量数据的导出,多人同时导出可以会对服务性能造成影响,导出涉及到mysql查询的io操作,
Java技术栈
1
美团还是快手,选个offer真纠结!
JavaGuide官方网站:javaguide.cn当面临多个还不错的 offer 时,做起选择是真心让人纠结,真心祝福各位都能有这种纠结的时候。纠结是正常的,毕竟选择一个 offer 的考虑因素太多了,并不仅仅是说谁给的钱多一点就跟谁干。如果真这么简单的话,那也就没啥可纠结的了。这篇文章我会结合一
JavaGuide
0
好未来测开一面,挺简单!(0428面试原题解析)
大家好,我是二哥呀。今天继续给大家分享春招面试题《好未来测开一面原题》,附详细答案,我会用通俗易懂+手绘图的方式,让天下所有的面渣都能逆袭 😁二哥的 Java 面试指南内容较长,建议正在冲刺 24 届春招和 25 届暑期实习、秋招的同学先收藏起来,面试的时候大概率会碰到,1、二哥的 Linux 速查
沉默王二
0