aizixun8 发表于 2024-12-25 07:11:15

美团智能客服系统详解:意图挖掘与情绪识别的机器学习应用

智能客服是利用自然语言与用户交互的人工智能系统。它分析用户意图,以人性化的方式与用户沟通,为用户提供客户服务。

本专题首先介绍了美团智能客服的对话交互框架,然后详细介绍了我们在其意图挖掘、意图理解、情感识别、对话管理等核心模块中使用的机器学习算法。

美团点评的使命是“帮助每个人吃得更好,生活得更好”。美团在线服务APP涵盖生活服务的方方面面,包括餐饮、外卖、打车、酒店业务等。美团2018年总交易额达5156.4亿元,同比增长44.3%; 2018年美团单日外卖交易额超过2100万笔,美团的各个App拥有大量的客服信息数据,这也为工程师提供了良好的培训场地。

1. 智能客服对话框架

当用户进入客服界面时,往往会带着一个问题来。所以我们要做的就是了解问题,然后根据了解结果请求相应的服务来解决用户的问题。主要分为两部分,一是离线训练和知识库编译部分,二是在线处理部分。

在线部分,首先需要提取问题的基本特征,如分词、语义标签提取、情感分析、NER识别等;然后进入下一层——意图理解层,主要包括问题领域分类、意图识别和属性提取。 ;意图理解后,进入对话管理阶段。对话管理模块主要包括状态跟踪(DST)和对话决策两部分。 DST 根据上下文状态明确当前用户的领域和意图,对话决策模块根据用户当前的意图确定后续动作;其次是业务服务层,包括各个业务的数据服务接口以及业务数据的呈现风格。

2.意图理解

美团围绕生活服务有很多场景和业务。对于客户服务,用户可以从单一业务窗口进入客户服务。这时候我们就知道客服服务属于哪个领域了;用户还可以从美团综合门户进入客服。在这种情况下,我们无法确定用户需要咨询哪个业务领域。

另外,从场景来看,主要涉及单轮QA和多轮Task。对于一些简单的问题,单轮QA就可以解决。例如:

U:美团外卖送餐时间

S:用户您好,能否送货以商家营业时间为准。如果您选择的商户已开业,则表示该商户可以提供订购和送货服务。

大量复杂的业务无法通过一轮QA完成。在这种情况下,就需要进行多轮对话。例如:

如何成为美团商家?

这需要多轮任务来解决。

由于美团覆盖了很多业务领域,当用户提出问题时,我们首先要把问题归类到某个业务领域,然后利用业务知识来解决问题;字段明确后,分类,根据问题类别的不同,使用的方法也会有所不同,比如问答、聊天等,这两方面接下来会详细介绍。

2.1 领域分类

对于领域分类任务,如上图所示,我们首先会收集来自不同业务的大量业务数据作为基础训练数据。虽然这些数据来自不同的业务,但仍然存在一些问题,主要表现在以下两个方面:

因此,原始数据不能直接作为训练数据,必须经过人工筛选和标注后才能使用。为了节省人力成本并提高迭代速度,我们采用了主动学习框架。模型的迭代主要分为以下步骤:

1、收集业务数据,并为每条业务数据打上相应的业务标签

2. 对数据进行模型训练

3.使用上一步训练的模型来预测样本

4. 标注器对预测样本进行标记,并选择错误的和难以分离的样本。

5.返回步骤2并重新训练标记数据。

我们还测试了不同模型上的领域分类效果。各个模型在实践中的效果如上图所示。从结果中我们可以看到BERT的效果非常高,但是我们也会考虑模型在实际运行中的效率。对于15个左右单词的查询,模型可以在10ms内解决。如果使用BERT模型,可能需要70ms左右。这个时间还是比较长的。目前,我们正在实际在线使用该模型。这是 Yoon Kim 在 2014 年提出的方法。

2.2 意图分类

https://img2.baidu.com/it/u=2383631357,600855428&fm=253&fmt=JPEG&app=138&f=JPEG?w=883&h=500

关于意图的分类,主要包括两个方面:问答式意图理解和基于任务的意图理解。

这两类问题各有特点。对于问答类别,我们使用检索和相似度排名策略。下图是问答类的设计架构。

对于基于任务的意图理解,我们使用规则和模型的组合。一种是通过规则,例如上下文无关语法,另一种是通过模型训练。

上下文无关语法

上图是一个例子。这种方法在业界还是很常见的。对于冷启动问题、高频问题和一般问题,规则方法都可以很好地解决。

多任务学习模型

在模型部分,我们将意图分类和属性提取联合建模为多任务学习(Multi-task)任务,如上图所示(算法详情参见Zhang,)。经过双向LSTM处理后,一方面通过分类输出想要的多分类结果(右边的y^u);另一方面,每个单词的槽位标签将通过CRF层进行标记。具体来说,对于“明天中午帮我找一家适合10个人吃饭的川菜馆”,模型应该能够识别出这是一个点餐意图,同时能够提取出时间“明天中午” ”、人数“10”以及菜品“川菜”等属性信息。

2.3 对话状态跟踪(DST)

DST仍然解决意图问题,根据当前上下文环境或状态明确当前用户的确切意图。

上图就是我们现在的框架。这是上下文信息。 NLU模块的输出信息可以是多个意图。我们需要将它与其他信息结合起来,比如订单信息、门户信息、入口信息等,明确它属于哪个领域。

如果字段不明确怎么办?我们的做法是和用户进行一轮澄清,并要求用户一次解决这个问题,这就是框架最左边的“不清楚就澄清”的逻辑。

一旦领域明确,下一步就是输入意图。我们需要澄清当前的意图是什么。当然,接收到的查询也面临着多意图判断的问题。我们还可以澄清一下,其中包括利用上下文信息来判断。 ,或者添加一轮与用户的交互来澄清。如果清楚,则继续以下过程。这是我们的整体架构。

举个栗子:

如果我们收到一条消息“牛肉汤溢出”,第一步就是确定它属于哪个字段。属于外卖商家领域。然后我们确定其意图。明确意图后,得知意图是“如何申请用餐?” “亏”,然后经历一顿亏的过程。

3. 知识发现

3.1 循环中的人

客户服务的目的是解决用户问题。人工智能在现有的工作流程中节省了人力,但机器解决不了的事情还是得靠人来解决。所以在下图中,我们必须添加一个手动传输服务。另外,我们利用无监督学习从日志中挖掘的知识点也需要人工“业务操作”来检查。在整个循环中,监督学习从知识库学到的语义表示能力可以提供给无监督学习,这将在下面进一步提到。

3.2 无监督学习在知识发现中的应用

无监督机器学习主要涉及两个问题,一是句子的语义表示,二是如何聚类知识。

在语义表示的问题上,我们做了很多实验。在迭代过程中,我们使用了DSSM模型、模型和BERT模型来计算意图的相似度。在这个过程中,我们发现不同的模型有各自的特点。 ,它可以捕获不同维度的特征。在离线模型中,我们使用多个模型的拼接来表示其语义向量。

关于知识点聚类问题,我们使用最常见的K-means模型。

https://img1.baidu.com/it/u=1155234290,3170316631&fm=253&fmt=JPEG&app=120&f=PNG?w=577&h=500

上面我们讲的是意图和陈述的挖掘。在实际业务中,我们会遇到很多Task问题。下图是“如何申请餐损”的任务树。

当用户的问题触发Task时,Task机器人根据与用户的通信获取槽位信息,调用不同的API接口获取槽位信息,然后回复用户。上图中“如何申请餐损”任务中需要明确的槽位包括“配送方式”、“餐损原因”、“申请状态”。其中,“配送方式”和“餐损原因”是通过与用户互动明确的。 “应用状态”是通过请求后台服务来确定的。

这个环节我们要做的就是辅助操作人员构建Task类知识。

我们根据用户的日志数据提取相应的意图,然后利用意图和回复的同现来发现用户提出问题后会问什么问题,以及用户收到反馈后会问什么问题。基于这些,构建任务子树。线下搭建完成后,交给运营同学。操作学员审核通过后即可上线。

4. 情绪识别

4.1 背景介绍

客户服务热线是我公司对外服务的重要沟通渠道。在售前、售中、售后各个环节发挥着重要作用,为用户提供意见处理、数据管理、技术支持等多重服务。但目前客服热线的运营仍存在一些痛点。例如,客服人员的服务水平参差不齐,导致客户体验存在差异。此外,个人客户还存在复杂的动机等问题。因此,如何利用技术提升客服热线的服务水平,及时发现热线中可能存在的风险,是一个需要解决的问题。本项目对客服热线中的语音数据进行挖掘和分析。通过量化用户的情绪能量值,可以追踪用户的情绪状态(是否兴奋、情绪倾向等),并在客户情绪超过设定阈值时提供预警信息。 ,以便相关人员和应急措施能够及时干预,从而为相关业务部门提供运营数据支持和智力支持,最终提高客服热线的服务质量和效率。

4.2 特征提取

FTT:短时傅立叶变换

每帧语音对应一个频谱(通过短时FFT计算),频谱代表频率和能量之间的关系。

梅尔滤波:实验观察发现,人耳就像一个滤波器组,只关注某些频率成分(人的听觉对频率是有选择性的)。换句话说,它只允许某些频率的信号通过,而简单地忽略某些它不想感知的频率的信号。

4.3 型号选择

特征处理完成后,使用哪个模型进行训练。

在迭代过程中,我们使用了传统的机器学习模型,例如LR和SVM。模型、神经网络模型和一些预训练模型。我们在这方面遇到的一个挑战是,整个通话记录都标注了某种情绪是否激动的标签,但用户在通话过程中并不总是意识到这一点。兴奋,而是某个通话阶段的情绪,一个标签无法反映出是哪一部分的兴奋,是完全的兴奋,部分的兴奋,还是完全的平静。事实上,这涉及到弱标签的学习。如下图所示。

这是2019年提出的算法,在实际应用中取得了不错的效果。有兴趣的同学可以根据信息进行搜索。

从实际结果来看,各模型的表现如下:

MFCC + LSTM < MFCC + CNN < + 级别 < + 级别

5、展望

以上就是我们目前正在开发和探索的智能客服理解部分的内容,从ToC的用户端和ToB的座席助理端优化整个客户服务闭环。

关于作者:

姜慧星博士是美团点评搜索与自然语言处理部自然语言处理中心研究员、智能客服团队负责人。主要负责美团智能客服业务及对话平台建设。曾就职于阿里巴巴达摩院语音实验室,从事智能语音对话交互研究。主要负责斑马智行语音交互系统、YunOS语音助手等主导产品。

团队介绍:

美团点评搜索及NLP部NLP中心秉承“让机器听懂人类语言,让机器与人自然对话,用数据构建知识大脑”的信条,致力于打造世界一流的自然语言处理核心技术和服务能力打造智能化客服对话平台打造自然语言处理平台和知识图谱(美团大脑),帮助美团智能化改造业务场景,提升美团的技术水平和品牌影响力。

目前,我们正在招聘NLP多个方向的算法和工程职位,包括但不限于意图理解、对话交互、意图推荐、风险识别、知识图谱等职位。基地位于北京和上海。欢迎加入我们的团队,请将简历发送至:

- 结尾 -
页: [1]
查看完整版本: 美团智能客服系统详解:意图挖掘与情绪识别的机器学习应用