京东智能客服言犀意图体系搭建和意图识别技术介绍

01 背景介绍
02 整体介绍

03 意图体系建立

04 意图理解
4.1 启发式问答
4.2高频问题识别

4.3长尾问题识别
4.3.1长难句识别

4.3.2上下文识别

4.3.3模糊问题引导

05 数据回流

06 领域预训练模型
1、没有融入智能客服相关领域数据集。
2、NSP(Next Sentence Prediction)任务无法充分学习到智能客服潜在语义关联性。
3、如何将多种任务类型很好的融合到预训练中,也将是预训练模型效果提升的关键。
Service Domain),专门针对智能对话领域进行预训练效果提升。除了针对性使用了对话领域数据集外,基于我们提出的提示性多任务并发训练方式,将多个对话领域的关键任务融入到模型预训练当中,提升了预训练模型的效果。
不同的first token标签,引导不同任务预训练。具体的,[CLS] token预训练学习SOP扩展任务、[QQ] token预训练学习相似度匹配相关任务、[QA] token预训练学习问答相关任务。基于以上方法产出的预训练模型,在京东智能客服言犀的多个业务线,以及各类任务上对比多种开源模型,均取得了最优效果。

07 未来展望
文丨俞晓光、王超、宋双永
-End-
评论




