本地生活综合性需求图谱的构建及应用
数据派THU
共 14723字,需浏览 30分钟
·
2021-07-30 23:41
来源:美团技术团队 本文约13000字,建议阅读20+分钟 本文介绍了本地生活综合性需求图谱的背景、体系设计和涉及的算法实践,并展示了在美团多个业务线的应用落地,希望给大家带来一些帮助或启发。
一、背景 1.1 业务现状 1.2 问题解析 二、解决方案 2.1 解决思路 2.2 具体方案 三、实现方法 3.1 行业体系层 3.2 需求对象层 3.3 具象需求层 3.4 场景要素层 3.5 场景需求层 四、应用实践 4.1 亲子 4.2 休闲娱乐 五、总结展望
一、背景
1.1 业务现状
部分指向性不明确的用户需求,较难得到适合的匹配结果。例如“周末陪宝宝去哪儿玩?”由于平台的匹配结果不理想,用户往往只能在线下完成类目决策,决定带宝宝去农家乐烧烤,再到平台上搜索相应的农家乐团购。 部分需求跨多个类目,匹配过程不够流畅。例如“周末和朋友去哪里放松一下?”用户在线下完成类目决策后,可选类目包括KTV、酒吧、密室、桌游等,但各类目的承载页面相互独立,用户需要在承载页面间来回切换。 在部分指向明确的类目中,用户仍然难以找到满足自己需求的供给。例如在医美类目下,因为缺乏相关知识,用户往往并不了解商户提供的形形色色的服务项目分别具有什么功效,适合什么部位,应该使用什么材料,无法高效地找到适合自己的服务供给。
1.2 问题解析
需求层次:在马斯洛需求层次中有一个情感层次,对应了人类丰富多样的情感需求,包含亲情、友情、爱情等等。作为一个母亲,与自己的宝宝之间往往存在一种强烈的母子情,并且希望不断去强化这种情感。 起心动念:为此,母亲往往都会尽力花较多的时间去陪伴宝宝。通过增加陪伴方式的维度,变为“陪宝宝玩”;通过增加时间、空间等维度,变为“周末陪宝宝去哪儿玩?” 考虑:对于上述问题,母亲会找出很多种方案,比如户外烧烤、农家采摘、主题公园等等。当她决定选用户外烧烤这一方案时,便会转化为具体的商品需求,如购买烤架。 评估选择:母亲于是在可触达的供给范围中进行选择。正如人们常说的货比三家,选择的依据会各不相同,如价格、质量、口碑等等。 交易购买:当完成选择之后,母亲便会进行交易,以换取商品或服务。 履约服务:即商品到货、完成服务等等。
二、解决方案
2.1 解决思路
分类层:构建完备的分类体系,包含了的大千世界的各种分类,既有通用的空间、时间等类别,也有电商中涉及的颜色、功能以及最为重要的品类等类别。 原子概念层:在分类层诸多类别的基础上进行扩展,包含了各种类别下的原子概念(例如空间->户外、事件->烧烤、时间->圣诞节、颜色->红色、功能->保暖、品类->连衣裙)及原子概念之间的关系。 电商概念层:在原子概念层之上,包含了由原子概念组成或直接挖掘的短语粒度的用户购物需求,即电商概念(例如户外烧烤),从而将用户购物需求显式地用一个符合自然语言的短语表示。 商品层:包含了商品与各种原子概念、电商概念之间的关联关系(例如户外烧烤->烤架、黄油、锡纸)。
2.2 具体方案
三、实现方法
3.1 行业体系层
3.1.1 行业类目树的构建
3.1.2 类目的供给关联
商户名、商品名及商品详情:均为文本数据,直接通过BERT[3]提取文本特征后输出。 商户UGC:由于商户的UGC往往数量非常多,为了对其信息进行有效利用,首先通过Doc2Vec[4]的方式进行Encode得到UGC的特征后,再通过一个Self-Attention[5]模块进行特征处理后输出。 商户画像:转成One-Hot特征后,通过全连接层进行非线性映射后输出。
3.2 需求对象层
第一种是无监督的扩充,在开始挖掘前运营会首先根据经验,提供一些玩乐对象词作为种子输入,我们提前利用语料构建无监督的Skip-Gram结构的Word2Vec模型,对业务输入的种子词提取词向量,并结合余弦相似度,快速扩充相关的对象词。 第二种是有监督的标注,我们将其定义序列标注问题,采用基于BERT+CRF的模型,在语料中自动识别出新的对象词。
3.3 具象需求层
3.3.1 具象需求挖掘
候选短语生成:围绕玩乐对象词,生成大量包含玩乐对象的短语,作为具象玩乐需求候选集。 短语质量判别:建立一个语义判别模型从候选集中提取真实的具象玩乐需求。
Wide部分,提取候选短语的全局和上下文的统计特征,通过全连接层进行非线性映射后输出。 Deep部分,提取候选短语的深度语义特征,通过BERT完成相应特征的提取后输出。
3.3.2 具象需求的供给关联
3.4 场景要素层
3.4.1 场景要素拆解
3.4.2 场景要素挖掘
3.5 场景需求层
3.5.1 场景需求组装
3.5.2 场景需求判别
四、应用实践
4.1 亲子
4.2 休闲娱乐
五、总结展望
更广的行业覆盖:一方面加深对已有的玩乐、医美和教育行业的建设,挖掘更多的节点和关系,更好的理解用户需求;一方面向丽人、结婚等更多的行业进行横向覆盖;此外还将进一步扩展到用户决策的全链路,构建服务体验图谱,覆盖履约服务环节,分析其中的用户需求和反馈,更好地赋能商家提升用户体验。 更多的数据引入:当前图谱的构建主要是以平台的用户和商户的文本语料为主,下一步将利用图像等更多模态的数据,并尝试引入外部的知识,对当前的节点和关系进行完善和补充。 更深的图谱应用:现阶段图谱在搜索和推荐上的实践主要集中在标签及其关联供给的直接应用,后续考虑进一步深化图谱的应用,充分利用场景需求和场景要素的信息,为推荐侧更准的用户意图识别提供支撑,从而提升供给和用户的匹配效率,发挥出知识图谱更大的价值。
参考文献
作者简介
编辑:黄继彦
评论