携程推荐算法暑期一面面试题8道|含解析-技术圈

13本七月在线内部电子书在文末，自取~

公众号福利

👉回复【100题】领取《名企AI面试100题》PDF

👉回复【干货资料】领取NLP、CV、ML、大模型等方向干货资料

问题1、讲讲推荐系统流程

推荐系统的流程通常包括以下几个步骤：

数据收集：收集用户行为数据（如浏览记录、购买记录、点击记录等）和物品数据（如物品特征、分类、标签等）。
数据预处理：对数据进行清洗、归一化、特征提取等预处理操作。
建模：如基于内容的推荐：根据用户对物品的特征（如文本、图像）进行推荐；基于用户的协同过滤：推荐与用户相似的用户喜欢的物品；基于物品的协同过滤：推荐与用户喜欢的物品相似的其他物品等。
模型训练：使用历史数据训练推荐模型，常见的方法有矩阵分解、神经网络等。
推荐生成：根据训练好的模型生成推荐列表。
评估与调优：使用评价指标（如准确率、召回率、F1-score等）评估推荐效果，并进行模型调优。
上线与更新：将推荐系统上线，并定期更新模型和数据。

问题2、Transformer 位置编码是什么

Transformer中的位置编码（Positional Encoding）是为了弥补自注意力机制中缺乏顺序信息的缺陷。因为自注意力机制不包含序列的位置信息，位置编码通过在输入的词向量中添加位置信息来引入序列顺序。

位置编码有两种常见方式：

问题3、QKV 注意力公式为什么除以根号 d

除以根号d_k的原因是为了防止内积值过大导致softmax函数的梯度消失问题。由于Q和K的维度较高，其内积的值会随d_k增加而增大，从而导致softmax的输出极端化（接近0或1）。除以根号d_k可以使得内积值的方差接近1，保持梯度稳定。

问题4、简单讲讲 GCN

GCN（Graph Convolutional Network，图卷积网络）是一种用于图数据的神经网络。GCN通过在图的节点上进行卷积操作来提取节点的特征。

基本的GCN操作步骤包括：

问题5、简单讲讲RNN

RNN（Recurrent Neural Network，循环神经网络）是一类用于处理序列数据的神经网络。RNN通过循环结构使得网络可以在序列的每个时间步共享参数，从而记忆和处理序列中的上下文信息。

RNN的基本结构包括：

问题6、RNN 里的参数有什么特点？

RNN的参数具有共享性，即在序列的每个时间步使用相同的一组参数。这使得RNN能够有效处理不同长度的序列，并在参数数量固定的情况下学习序列中的时间依赖关系。

问题7、Dropout 是怎么做的？有什么作用？推理和训练时 Dropout 的区别？如果推理也用 dropout 会怎么样？

Dropout是一种正则化技术，通过在训练过程中随机丢弃（即设置为零）一部分神经元来防止过拟合。具体步骤为：

作用：通过随机丢弃神经元，减少节点之间的相互依赖，从而提高模型的泛化能力。

训练和推理的区别：

如果推理时也用Dropout，模型的输出将变得不稳定，因为每次推理时网络结构都不同，导致结果不可预测且精度下降。

问题8、讲讲 BN？BN 训练和推理什么区别？有什么用？

Batch Normalization（BN）是一种加速深层神经网络训练并提高其稳定性的方法。BN通过对每一层的输入进行标准化，使得输入具有零均值和单位方差，同时允许网络学习最优的均值和方差。

训练和推理的区别：

作用：

免费送

↓以下13本书电子版免费领，直接送↓

扫码回复【999】免费领13本电子书

（或找七月在线其他老师领取）

点击“阅读原文”抢新人福利~