京东搜索重排:基于互信息的用户偏好导向模型
共 3994字,需浏览 8分钟
·
2024-08-26 11:54
SIGIR 24: A Preference-oriented Diversity Model Based on Mutual-information in Re-ranking for E-commerce Search
1、背景及现状
•用户从搜索到下单过程中存在不同的决策阶段(买、逛等),用户不同的决策阶段对多样性也有不同需求,现阶段模型没有直接建模不同决策阶段和多样性的关系。
重排阶段需要充分考虑用户需求。通常来说,用户的需求是个性化的,即部分场景下对于排序结果的准确性要求较高,而另一部分场景下对于排序结果的多样性要求较多。在这种情况下,一个合适的重排排序算法应该自适应地根据用户需求进行结果调整,即当用户需要多样性时,搜索排序结果应当包含尽可能不同的商品来满足用户的多种兴趣来满足用户的多样性需求;而当用户需要准确性时,排序结果应包含最符合用户或用户最感兴趣的单一类别商品。例如,用户从搜索“连衣裙”到逐渐缩小范围到“荷叶边连衣裙”,这一过程中,他们的搜索意图从多样化逐渐变得明确和具体。要在重排阶段平衡效率指标和多样性,我们面临两个主要挑战:
1.准确建模用户的决策意图困难,因为其意图会在多次搜索中逐渐演变。
2.即使成功建模了用户的意图,如何加强搜索结果与用户演变意图的匹配关系?
为了解决这些挑战,我们提出了PODM-MI(基于互信息的偏好导向多样性模型)。
2、PODM-MI
PODM-MI模型以排序列表和用户行为数据(如点击流和加入购物车的行为)为输入。首先,我们使用PON捕捉用户的多样性偏好和候选商品的多样性表示。然后,SAM增强用户多样性偏好与候选商品多样性之间的一致性。从这种增强的一致性中,我们得出一个效用矩阵,该矩阵会动态调整用户偏好,从而重新排序最终的排名结果以更好地满足用户需求。
2.1 PON 用户偏好建模
2.2 SAM 利用互信息优化排序结果
然而,估计和最大化互信息通常是不可行的。为了解决这一挑战,我们借鉴了变分推理的文献,引入了一个变分后验估计器。该方法允许我们为互信息目标推导出一个可行的下界。
在增强一致性之后,我们设计了一个可学习的效用矩阵,以进一步使最终的排序结果与用户偏好对齐。该矩阵通过可学习权重矩阵与对齐特征的点积获得。然后,我们将效用矩阵与从主干网络计算的分数相乘以得到最终结果。
优化函数:
前者是prm分类loss,后者是互信息loss
2.4 实验结果及可视化分析
进一步的,我们对用户query流降维后的趋势使用TSNE可视化,同时降维可视化需要label足够明显,所以采用人工分桶的方法,对排序结果的多样性熵进行人工分桶,分成多个label。可以看出,不同发散收敛趋势的query流有着很明显的分层,query流同对应的熵聚集在了一起,这表明不同的query流的发散趋势对应着不同的结果的熵。也就是说,query流越发散,session的排序结果越发散,query流越收敛,session的排序结果越收敛。
此外,我们还用一个更具体的案例来说明我们方法的有效性。当用户的历史搜索查询非常多样时,如:Switch,塞尔达,手机壳,锤子,油烟机,排气管,在这种情况下,当用户输入“蔬菜水果脱水机”后,我们的方法比基线方法产生了更多样化的结果。另外,还有一个收敛趋势的案例。当用户搜索“连衣裙”并访问相应的店铺后,再次输入该店铺时,我们的方法比基线方法产生的结果更加集中,并且更好地与用户的历史搜索记录相匹配。
3、未来迭代方向
• 引入更精细的特征,更好的建模用户的逛买意图
Note:
欢迎大家交流与探讨,如有任何问题或建议,请随时联系:{wanghuimu1, limingming65}@jd.com。
我们京东搜索算法部目前有大量的社招和实习机会,诚邀有志之士加入。无论您是技术专家还是新兴人才,我们都期待您的加入,共同推动技术的进步和创新。欢迎大家踊跃投递简历,期待与您在京东相遇!
分享嘉宾:
扫一扫,加入技术交流群