当Elasticsearch遇见智能客服机器人

共 2086字，需浏览 5分钟

·

2022-02-09 17:41

内容来源：2017年6月10日，趋势科技个人消费者部机器学习工程师杨文俊在“Elastic Meetup 南京”进行《Elasticsearch辅助的智能客服机器人》演讲分享。IT 大咖说作为独家视频合作方，经主办方和讲者审阅授权发布。

阅读字数：1605 | 4分钟阅读

获取嘉宾演讲视频及PPT，请点击：http://t.cn/RDLShYJ

摘要

本次分享主要会介绍一下ES是如何帮我们完成NLP的任务的。在做NLP相关任务的时候，ES的相似度算法并不足以支撑用户的搜索，需要使用一些与语义相关的方法进行改进。但是ES的很多特性对我们优化搜索体验是非常有帮助的。

简介-Dr.cleaner/Dr.X系列产品

我们主要服务的项目是MAC上的APP——Dr.cleaner以及Dr.X系列产品。

Dr.cleaner在多个国家、地区的清理类MAC APP中排名第一，日活接近百万。

幸福的烦恼：客服

多语言、跨时区：我们的APP在国内可能还不是非常出名，它的目前的客户基本都在海外，其中美国是主要客户，同时也有其它国家跟地区的用户。

数量跟不上：随着用户数的急剧增加，客服的数量跟不上用户数的增长。

解决方案：客服机器人

客服机器人首要能解决产品相关的问题，其次要能解决MAC/IOS相关的技术问题，多语言的问题需要通过翻译API翻译成英语再尝试给出解决方案。

知识库的构成

任何智能客服如果没有足够的知识库支撑，即使它的算法再强大也不行。所以我们把很多MAC相关的网站抓下来塞进我们的数据库中。

各种爬虫

StackExcangeApple分论坛（公开数据源）、Apple Discussion、Mac world、WikiHow…

文档搜索

当用户问题出现的时候，我们如何从文档知识库中找出我们需要的东西？我们之前尝试过直接使用ES，但是距离语义还是太远了，效果并不好。

WMD也有明显缺点，它的算法复杂度非常高，计算速度很慢。WMD不是银弹，即使WMD之后也可能会得到一些不太好的结果。

我们的知识库会先经过ES过滤一层。原始的知识库大概是几十万级别，如果直接用WMD计算的话速度会非常慢。ES在一定程度上保证了它的字面差得不会那么离谱，当字面比较相近的时候它还是能匹配出一些东西。

ES具体操作

这个是最原始的mapping，我们基于这个mapping一步步去做优化。

优化：BM25 or TFIDF

采用BM25之后，当一个词的出现频率越高，到一定的阈值之后，它的影响是非常小的。

我们做了一个实验，修改了mapping，分别使用BM25 or TFIDF。从知识库中随机选取100个问题和10个回答，让ES进行查询，然后对比两边的结果。

我们一共进行了10轮，每轮会有100个回答。如上图可见，两个算法的重复度大概是91%。

根据实验得出，BM25的作用还是比较明显的，最终我们采用了BM25去做相似度的算法。

优化：拼写检查与纠错

我们的方案：Term Suggester + Custom Analyzer

使用Term Suggester

支持直接输入一句话：How to replace macbookk SSD？

Term Suggester自身调整

设定最小出现次数为3，修改了”string_distance”，把它改为”jarowinkler”。它默认的相似度是基于编辑距离的一些定制化，编辑距离默认会输出整数。

改进方法

增加用户行为数据的支撑。Google的算法很大一部分就是有用户行为数据支撑。

“瞻前顾后”，从我们的角度来说，要考虑前后两个词的关系。

优化：输入标准化

解决方案

首先使用Gensim生成备选词组，然后使用规则过滤出比较精确的候选词组。当我们获得一个正确的词组后，可以根据候选词组生成常见的错误写法。最后再实时处理用户输入和批量处理ES存储的知识库。

规则

规则就是纯英文字符，去掉数字。主要是品牌名和版本号。

POS Tagging + 词性过滤

WHY?

WMD的计算强度比较大，如果我们在输入词中能把一些不重要的词去掉，就可以降低WMD的计算强度。

在我们的一些知识库中，它的表达方式不一样。但重要的词换一个表达方式，能够提高准确率。

解决方案

当前我们的解决方案用Python NLTK进行分析过滤，输出每个词的词性，ES存储结果。

我们更为推荐的是使用ES分析、过滤、存储一条龙解决方案，但是这种解决方案需要自己写一个ES的Pos插件。

推荐方案的优点

性能：Java实现的东西一般来说要比纯Python的快，特别是在比较消耗CPU资源的时候。

简单：逻辑不需要在ES和Python两边同时维护。

节省空间：NLTK的模型文件也比较大，多个Docker镜像就意味着占用多个内存、磁盘。

优化：同义词

基于Word2vec的同义词

人为地定义同义词很难，我们是基于Word2vec生成“同义词”。

查询改写方案

我们的同义词方案是通过同义词进行查询改写。

其它一些优化

LTR：Learning to Rank

基于Machine Learning的重排序，模型按照预测的点击概率进行重新排序。

我今天的分享就到这里，谢谢大家！

浏览 14

点赞

收藏

分享

举报

评论

图片

表情

智能客服机器人

随着人工智能的不断发展，很多企业已经感受到智能化与数字化对企业营销带来的巨大影响，客户服务是企业品牌经营的核心问题，我们可以发现为了做到更好的客户服务，传统的客服体系“堆人”的方式已不能满足企业日益增进的业务需求了，因而智能客服机器人的出现成为了焦点，成为企业全新的现代化服务方式。智能客服机器人的使用具体改变了企业哪些客服服务模式呢？下面美洽小编给大家详细介绍。企业使用智能客服机器人的优势：客户接待更高效传统的客服接待方式只能满足企业日常的需求，如遇活动等咨询高峰期，人工客服是无法保证及时接待的，而使用智能客服机器人能在人工座席繁忙的时候自动引导客户，能很大程度的减少由于繁忙而流失在咨询等待中的客户。智能客服机器人能

智能机器人客服

智近年来人工智能已渗入工作生活中，由于AI智能技术越来越成熟，智能客服机器人已经成为客服系统发展的一种趋势。客服机器人分为在线客服机器人和智能语音机器人。智能语音电话机器人客服能：一、节省80%以上客服人力采用最新智能客服技术，利用机器人语义分析和深度学习能力，整合多年行业语料，真正理解顾客提出的高频问题，从而精准回答，最大化节省客服人力。高峰繁忙，分担人工客服接待压力；区分接待，分配流量资源，人工客服接待高质量访客；离岗开启，提高碎片时间利用率；夜班上岗，避免夜间无人值守导致访客流失二、提升5-10%对话转化率人机协作区分接待，人工客服集中精力去接待来自优质渠道、点击精准投放词进入的访客，低质量渠道

智能客服机器人电话机器人

智能客服机器人的类型： 1、在线智能客服机器人在线客服机器人可以通过文字进行识别，通过语义理解、对话管理、深度学习等技术实现线上同用户沟通，根据客户需求自动回答有关产品或服务的问题，特殊问题转接人工客服。在线智能客服机器人在人工下班时，可推送表单由客户填写，表单与工单自动关联，工单流转，减少客服人力成本。 2、智能语音机器人智能语音机器人通过语音进行识别，基于多语种自然语言处理、深度语义交互、真人语音交互,自定义客户识别维度，遇到回答不了的问题，会自动转人工客服。智能语音机器人不仅可以用于售后服务来被动回答客户问题，还可以用在营销推广，来主动向客户播放产品语音。智能客服机器人回答问题的流程：智能客服机器人回答问题

智能客服机器人排名？

前言：智能客服机器人排名？智能客服机器人哪个好？Live800结合自身简要从企业需求、机器人数据表现、厂商综合实力进行分析。智能客服机器人的排名是没有统一的标准的，同一个智能客服机器人在不同企业的不同需求下，可能会有不同的评价。同时智能客服机器人也有很多的种类：智能客服机器人、智能营销机器人、智能外呼机器人等等，因此很难界定。但企业可以从这三个维度进行判断：企业需求、机器人数据表现、厂商综合实力维度一：企业需求企业对智能客服机器人的需求，决定了智能客服机器人的种类： 1、企业看重机器人的营销价值，那么显然智能营销机器人比普通的智能客服机器人更好用。 2、企业仅需要机器人做简单的回答，那么普通的智能客服机器人

智能客服机器人好不好？

服务业做为第三产业，是社会大分工的产物，服务水平在一定程度上体现了文明的程度。所以，提高服务水平并不能单单是看成商家追求利益的手段。好的客服是企业成功的关键！如今的企业都有自己的客服中心，帮助公司做意见处理，技术支持等一些工作。智能时代智能客服机器人也由此诞生客服每天要接到的电话非常之多，特别是在一些售后客户，投诉中心，难免有些情绪较为激动的客户因为各种各样的原因爆粗口。经常遭到辱骂，工作压力大，导致人员流动性大，培训成本随之增高。而大环境使然，用人成本也只会越来越高。这个时候肯定就会想到永远忠诚，永不疲惫的电话机器人客服。电话机器人好不好用单纯从筛选意向客户角度，只要你合作的不是一些做贴牌的AI电话机器人厂商，

智能客服机器人有效提升客服质量

智能客服机器人可以有效提高客户服务质量。智能访客分配可以根据访客与智能客服的互动行为和沟通内容进行分流判断，并根据企业预置的分配规则将访客分配给相应的目标客服人员，为了保证服务的及时性和连续性。　　智能客服机器人可以单独接待来访客户，智能客服机器人具有强大的知识基础和自主学习能力，能够在接待过程之中积累问题。一个成熟的客户服务机器人的问题解决率非常高，大多数客户问题都可以快速解决。除了自动接待回复之外，在人工客服接待过程之中，机器人还可以通过推荐回复或搜索知识库提供接待协助，从而提高企业人工客服的接待效率和服务质量。　　智能客服机器人可以实现客户服务的连续性，及时响应客户问题，改善客户体验。一般来说，机器人的自动回复时间一般

智能客服机器人的分类

自2017年国务院提出《新一代人工智能发展规划》开始，国内发展人工智能的步伐一路高歌猛进，不仅有中央政府、地方政府的大力支持，科研机构、高校院校、AI企业也都重点布局人工智能行业。国内的AI产品也从概念化走到了市场化，从实验室走到了人们的日常中；而作为劳动力重复、工作强度大的人工客服岗位，也引入了人工智能技术，并创造出了一款可以帮助客服企业提高工作效率、降低人工成本的新产品“智能客服机器人”。智能客服机器人的应用场景非常丰富，根据其使用目的的不同，我们可以大致分为以下几个类型：一、在线智能客服机器人在线客服机器人可以通过文字进行识别，通过语义理解、对话管理、深度学习等技术实现线上同用户沟通，根据客户需

什么是智能机器人客服

从“人工智能”一词提出到发展到现在应用于工业机器人领域，已经过去六十多个年头。六十年来，世界各国从未放下对人工智能领域的研究。在工业领域，货物机器人走进工厂；在生活领域，机器人服务员配菜送菜，且按照事先输入的指令服务顾客；在艺术领域，能歌善舞的机器人出现在了2016年的春晚上；在客服领域，机器人客服能替代人工客服为企业节省人工成本。技术一直在发展，没有人能够否定科技所带来的实质性变革，每当一种新鲜事物诞生的时候，就必然有传统的东西在阻挠，但是时间可以改变很多东西。在过去的六十多年，人工智能发展缓慢，但总体上一直是发展前进的。因为科学家们深信，科技总是不断前进，技术不断飞跃，人类社会总是一直向前发展的。像由机器人所引发的人工智能

智能客服机器人怎么选择？

【智能客服机器人怎么选择？】随着智能客服机器人的普及，市面上出现了越来越多的智能客服机器人，价格高低不等，服务水平参差不齐，客户想要购买智能客服机器人不得不练就火眼金睛，才可以找到真的不怕真金火炼的高质量机器人，那么有什么好的办法可以快速找到高质量服务商提供的机器人呢？下面，小编给大家介绍一下选择智能客服机器人的几大要素： 1、看企业实力。企业实力主要看公司人数，公司营业执照以及公司专利证书，这些都是判断一家企业是否正规和优秀的标志。如果是一个贴牌公司，公司人数肯定是偏少的，公司营业执照上应该也是没有资格做智能客服机器人这个项目，更何况还需要投入大量人力物力进行研发的专利证书，小公司更是没有钱财做的。 3、运营

小微智能客服机器人

杭州微洱科技有限公司　　微洱科技由阿里资深专家团队创建，小微产品由专家团队及Google最高华人工程师联合斯坦福大学和加州大学教授共同研发；　　成立于2016年12月，总部位于杭州未来科技城，毗邻阿里巴巴；　　通过意图识别、语义理解、多轮对话、知识挖局、机器阅读和淘系规则解读打造一款会营销的AI智能客服机器人，从AI智能层面深度解读并赋能【买家—规则—商家】之间利益闭环，助力构建客户价值变现最大化智能体系；截止目前客户已遍及全国100多个城市。在现在这个经济飞速发展的中国，AI人工智能在我们的生活中已经到达了一个不可或缺的地步，人工智能也在一步步向着我们所做的行业渗透。　　微洱科技致力于AI变革世界。我们的使

点赞

收藏

分享

举报