本文PPT,在微信公众号「DataFunTalk」,回复「先行者」领取
导读:当NLP遇上客服系统确实会发生一些美妙的事情,下面我分享的内容将围绕美团客服系统中一些比较前沿的技术展开,希望能对大家有所启发。
今天分享的内容主要分为以下几个方面,第一部分首先对美团的客服系统进行简单介绍,第二部分是本次分享的重点,包括我们采用了什么样的技术方案,技术方案的具体的技术组件是怎样实现的,背后有着怎样的思考等等,第三部分展示我们所做的工作在美团客服系统的落地效果,第四部分对本次分享做一个总结。总体上来说,客服不是一个纯靠人可以解决的问题,也不是一个纯靠算法可以解决的问题,而是需要人机协同解决的问题。同时,它也不是一个静态的系统,它需要不断地进化不断地运营。
01
客服系统简介
首先我们回顾一下客服系统的演变历史。客服系统的原始阶段是语音呼叫中心,这种客服系统纯靠人工服务,且支持语音电话,效率低成本高。第二阶段进化到了网页在线客服,这种客服系统基于网页会话,服务形式支持文本和语音,同时还利于对流量数据进行挖掘。随着移动互联网的兴起,便有了SaaS客服系统,这种客服系统支持多渠道接入,有了丰富的辅助功能和知识库管理。如今客服系统进化到了智能客服,它最大的特点就是人机协同,许多简单问题都可以由机器自主解决,这个系统可以自主学习不断进化。回顾客服系统的演变历史可以发现,智能化是客服系统的一个演变趋势。
然后我介绍一下对话系统。对话系统主要包括四类:问答型对话、任务型对话、闲聊型对话、图谱型对话。在问答型对话中,我们使用QABot机器人完成简单任务,这种对话通常是与上下文无关的单轮对话。在任务型对话中,TaskBot机器人完成特定场景下的复杂任务。另外还有ChatBot闲聊型机器人,这种对话通常不以解决实际问题为目的,我们的客服系统也有用到这种机器人。最后是图谱型机器人KBQA,这种机器人可能更多地用在金融、医疗等领域,但还未有成熟的系统,这方面我们也还处于探索中。
根据智能客服机器人的智能水平,可以将其分为四个档次:简单检索机器人、语义识别机器人、场景导向机器人、智慧机器人。简单检索机器人只支持特定类型的检索,只要说法稍微一变可能就不能正确识别,匹配性较差。语义识别机器人基于知识库,可以更智能地理解所检索的问题。场景导向机器人根据不同场景量身定制机器人,机器人的聪明程度与场景有关。智慧机器人是智能程度最高的机器人,甚至可以达到拟人的程度。现在来看,大多数机器人还只是停留在第二个阶段,能达到第三个阶段的还是少数。
美团的业务种类繁多,不同的业务所需要的客服系统也不尽相同,这无疑给我们提出了严峻的技术挑战。上图是客服系统的整体框架图,蓝色部分代表了前面提到的nlp技术对原来客服系统的改进。在用户端我们设置了QABot、TaskBot、ChatBot等机器人,在座席端运用了话术提示、转接提示、情感分析等技术。
--
02
智变之路
下面进入本次分享的第二部分:智变之路,主要聚焦于我们在这个过程中做了哪些工作以及我们背后的思考。
原来的客服系统系统中客户将请求传送到客服服务器,然后客服操作平台就会分配相应的人工客服处理相应的客户请求,客服操作平台只具备简单的知识管理功能。这种客服系统最大的问题就是效率低,需要的人力成本高。对于这样的客服系统来说,实际上需要的人工客服数目和订单数目是成正比的。美团现在的业务正处于飞速的发展过程中,现在就有近万名客服人员,如果不对客服系统进行改进,可以想象未来这个队伍还会扩充很多倍。基于原来客服系统的这些缺点,我们对这个架构进行了改进,增添了会话管理服务,后面连接着QABot、TakBot、ChatBot等机器人以及人工服务,有一个专门的知识管理平台来支撑QABot、TakBot、ChatBot,AI训练师对知识管理平台设计离线学习和自动训练的算法。除此之外我们还设计了话术提醒、舆情监控、转接提示等模块来辅助人工客服。
我们也研究过做字典的必要性。以上图片来源于对外卖的日志数据分析,可以看出只是“外卖配送超单”这一个问题对应的问法就有16000多种,原客服系统的简单检索很明显不能满足这种需求,让检索系统具有一定的语义识别能力十分必要。
要做好一个AI系统必须满足这样的条件:要有大量业务专家、要有强大算法团队、要有大规模GPU计算引擎、要有海量场景数据,这些条件在美团都是满足的,这无疑给了我们使智能客服系统落地的信心。
这是我们智变的思路,我们采用三级漏斗的方式,把问题分为了三类,第一类简单咨询问题由QABot解决,第二类高频相关的复杂场景下的问题由TaskBot解决,最后TaskBot解决不了的任务再借助人工客服来解决。我们算法的目标就是随着时间的演进,不断地把更多的任务转向机器解决。
这是我们的系统架构,当一个请求来临时,先进入我们的意图识别领域,然后被识别到对应的业务领域中,把对应的知识点识别出来。如果识别出来的是一个比较简单的问题,直接检索就可以得到答案,如果它是和用户订单状态或者行为有关系的复杂问题,需要根据场景生成不同的答案。比如对于催单问题,订单状态不一样所需要的回应也不一样,如果用户刚下订单就要催单,此时告诉用户骑手的位置比较合适,但用户是在等了一个小时的情况下催单,此时需要先安抚客户的情绪。而对于多轮的任务,如客户支付宝支付无法使用,这种任务需要调用好多层才能完成,此时就会调用TaskBot。
接下来介绍一下单轮会话的QABot。它主要由两部分构成,其中一部分是线上的语义识别,另一部分是线下的客服运营,运营的目的是发现更多的标准问题以及更多的关联问题。另外后面还有一个交互层,交互层有可能触发Task或者直接生成答案。
语义识别主要指把不同的问法规整到标准的问法上去,感受一下上面的例子,不同的细节表述其实都是在说餐品有质量问题,而语义识别的目的就是要找到检索问题的标准表述。为了解决这个问题,我们综合运用了搜索技术、翻译技术、图谱技术、深度学习和统计学习技术。
语义识别的流程模拟了人解决问题的思路。人类在解决一个问题的时候会首先考虑以前有没有类似的问题,对应于语义识别中我们也首先采用搜索检索的方法。在找寻相似问题的过程中,人类通常会考虑:“我们要找的到底是哪些问题呢?”,对应于语义识别中,这是一个对问题进行候选筛选的过程。当人类发现一些问题明显和意图无关,通常要把他们去掉,对应于语义识别中,这就是要进行意图识别从而筛选问题。面临最后挑选出的几个问题,人类通常要对其进行优先级排序,对应于语义识别中,这就是Rank的过程。最后人类可能还会对结果进行检查:“问的确实是这个问题嘛?”,这就是语义识别中的语义完整性检查。这整个过程中运用了各种各样的模型来达成语义识别的目的。
先介绍一下基于匹配的识别。基于匹配的识别利用拓展问与标准问的并行数据作为训练语料,把拓展问Ngram特征串作为关键词建立倒排,Ngram特征分布作为权重,在外卖的例子中只用Top20就能达到99.76%的权重。这一步的筛选为后面模型节省了很多时间。
下面介绍一种深度模型—DSSM模型。DSSM模型是一个双塔模型,它在句子embedding上效果很好,因此我们也借鉴了这一模型。我们把标准问与拓展问语义相同的句子对作为正例,把标准问与拓展问语义不同的句子对作为反例,训练了DSSM模型。模型训练后,对于任给的一个问题,可以得到它的embedding结果,和其他标准问embedding结果相对比就可以算出相似度。比如拓展问“我的外卖怎么还没到”可以计算出一个Sentence Vector,而标准问“配送超时催单”和“餐品有质量问题”分别有一个Sentence Vector,通过计算可得,“我的外卖怎么还没到”和“配送超时催单”的相似度为0.98,我的外卖怎么还没到”和“餐品有质量问题”的相似度是0.62,所以可以把“我的外卖怎么还没到”的语义识别为“配送超时催单”。
还有一个效果很好的深度模型—Seq2seq模型。Seq2seq模型本身是一个生成模型,但是我们把它用来计算句子之间的相似度,我们把它encoder和attention的结果和不同的候选做loss计算,把loss作为一种度量结果,Loss越小代表输入和候选越接近。以上两个深度模型是我们尝试过的深度模型中效果最好的两个。
我们还采用了一种基于图谱的识别方法。因为美团积累了很多图谱信息,美团大脑项目里面有亿级的实体数量,相互之间的关系超过5亿,实体与实体之间的关系可以做一个embedding,这样实体就可以变成一个向量表示,而这种向量可以作为一种特征和其他显示特征联合在一起提供给聚类分类算法,这样会使算法效果有很大的提升。
还有一种对知识图谱的用法,我们从图谱中抽取一些近义词上下位等关系作为并行语料放入一些模型中去,这样对原有语料进行了很好的扩充。
还有一种模型:基于实例的翻译。Nagao1984年时提出过这样一个理论:人类在翻译简单句子时不会进行深层次的语义分析。这是一种很简单的思想:从已知的实体中找到和问题最接近的,把它的答案作为问题的答案。
这是一个简单的例子。我们的语言库里面已经有“怎么都没人接单啊”、“怎么还没人接单呀”、“怎么今天没人接单”等句子,库里面这些问题的答案都是“无骑手接单”,此时来了一个新的问题“怎么会没人接单呢”,通过相似性可以推断出它的答案也应该是“无骑手接单”。
下面介绍一个进行意图识别的模型。我们根据业务逻辑进行建模,对于外卖来说,可以把问题分为几个大类,比如配送类、红包类、支付类、账户类等等,不同大类之间的问题关系可以依据业务逻辑分别被定义为互斥或者相容,根据这些关系可以对候选问题进行语义层面的筛选。根据筛选结果对候选问题进行过滤。
上面介绍的都是QABot用到的模型,下面介绍一下TaskBot的整体框架。TaskBot在我们这里被定义为一个执行引擎,在架构上它是这样的,请求来临后,先进行意图识别,出发对应的Task,Task把对应的决策树load到内存里边,然后它会对决策树的节点状态进行记录,之后调用情感识别、语义识别、实体识别等服务进行分析决定节点之间的状态流转。
--
03
闲聊机器人
ChatBot不以解决实际问题为目的,主要用来和用户进行情感交流。我们采用两种方式来做ChatBot,第一种是检索式,构建一个闲聊库,检索给出答案,第二种是生成式模型,从闲聊库中学习生成模型。生成式比较具有挑战性,因为客服系统是一个比较严肃公开的平台,必须保证会话的可控性。
这是我们QABot的落地情况,数据来自于外卖场景,每天解决72,000个问题,算法离线准确率达到92%,在线智能解决率83%。
这是TaskBot的落地效果,业务场景是打车领域,针对打车司机平台派单少这一问题,TaskBot的上线方便了司机自助地解决问题,大大提升了这一问题的智能解决率和智能解决量。
--
04
总结
最后,对本次分享做一下总结。智能化是客服系统发展的趋势,是解决有限的客服资源与不断增长的海量用户服务请求矛盾的唯一选择。实践证明,智能化客服确实可以大量消除人的重复劳动,业务专家也可以从繁杂中解脱出来,可以有更多的时间进行方案优化。最重要的一点,智能化客服系统不是一个纯人的系统,也不是一个纯算法的系统,也不是一个静态的系统,它需要人机协同,自主学习不断进化。还有一点,客服系统现在还主要用于售后方面,我们现在也在售前的相关研究,后面我们也会把它用于智能营销、导购等流程中,这方面我们也在探索。
今天的分享就到这里,谢谢大家。
阅读更多技术干货文章、下载讲师PPT,请关注微信公众号“DataFunSummit”。
分享嘉宾:刘学梁老师
编辑整理:赵富旺同学
内容来源:2018AI先行者大会《智变中的美团客服》
出品社区:DataFun
01/分享嘉宾
刘学梁,美团AI平台部NLP中心客服算法团队负责人,研发的智能客服系统已上线服务于外卖、打车等领域。曾就职于微信,从事机器翻译、语音识别相关基础算法研究工作。
02/报名看直播 免费领PPT
03/关于我们
DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章700+,百万+阅读,14万+精准粉丝。
评论列表(0条)