聊天机器人中用户出行消费意图识别方法
【原文:钱岳, 丁效, 刘挺, 陈毅恒《聊天机器人中用户出行消费意图识别方法》-载于2017年3月“中国科学:信息学科”第47卷第8期】
一、背景
传统的消费意图识别主要使用基于模板匹配或者基于人工特征集合的机器学习方法, 这类方法费时费力, 扩展性不强。本文将出行消费意图识别任务看成一个分类问题, 结合深度学习方法识别用户的出行消费意图。
二、问题描述
本文主要研究3个领域的出行意图识别任务,分别是订机票意图、订火车票意图和订酒店意图,即四分类任务。
三、模型
本文将 CNN 与 LSTM 模型进行整合, 使用基于 Convolutional-LSTM 的出行消费意图,基本流程如图1所示:

图1基于 Convolutional-LSTM 的出行消费意图识别模型(引自原文)
(1) 输入层:给定长度为n的用户聊天文本,可表示为:

(2) 卷积层:用于聊天文本中第i个词到第i+h-1个词,卷积核通过下列式子所示的卷积操作得到一个特征表示:

卷积核依次对句子中所有窗口进行滑动,卷积得到一个特征图。
(3) 特征组合层:特征组合层的每个向量通过将卷积后的每个特征图的第i维对应的元素顺序相连得到, 如下列式子所示:

(4) 长短期记忆层:如下列式子所示:

(5) Softmax层:其输出可解释为条件概率,根据概率的值来识别聊天文本到底属于哪一类出行意图
四、实验结果
该模型采用 Precision (准确率)、Recall (召回率) 和 F-measure 来评价分类器的性能,实验结果如表1所示。
实验结果表明, 使用 Convolutional-LSTM模型时,其在测试集上的各项指标都有所提升,表明了该模型的有效性。

表1意图识别实验结果(表数据引自原文)
五、结论
CNN能从文本中提取深层的特征,而LSTM能够学习到用户聊天文本的上下文时序关系对语义的影响。Convolutional- LSTM模型结合了CNN与LSTM的优点,使得性能有所提升,对于聊天机器人中用户的出行消费意图识别是行之有效的。
撰稿:蔡坤钊
审稿:丁美荣