视频实时评论的深度语义表征方法
【原文:吴法民 《视频实时评论的深度语义表征方法》- 载于2019年2月“计算机研究与发展”2019年02期】
弹幕作为一种新型的视频评论方式,以其高度实时性的特点,广泛活跃在视频网站和直播平台等媒体平台中。但是由于弹幕具有短文本,高噪声,语义模糊等特性,使得传统的自然语言处理技术很难处理此类问题。本文作者提出了一种基于循环神经网络的字符级深度语义表征模型,可以更好的抓住弹幕中的隐含语义等特征信息。同时通过基于语义检索的弹幕解释框架,对该表征方法进行验证。
1. 基于字符级别编码解码的循环神经网络
本文将出现在同一个视频中,时间间隔在一定范围内的弹幕定义为语义相似弹幕,再将所有相似弹幕按照一定的比例划分为训练数据和测试数据。训练时通过从相似弹幕集合中随机选取两个弹幕通过Encoder编码为语义向量,再经过Decoder解码为输出弹幕,最后通过计算损失值判断模型是否收敛。
模型结构如下:
2. 基于深度语义表征的弹幕检索
利用训练好的深度语义表征模型,对训练数据进行编码得到语义向量,对生成的语义向量集合使用局部敏感散列算法建立高维数据空间索引。
输入弹幕进行检索时,使用训练好的深度语义表征模型对输入弹幕进行编码,得到语义向量,再利用构建好的高维空间索引,查找距离最近的k个语义向量 ,将这些向量输入decoder解码得到上下文相关的弹幕。
撰稿:丁明浩
审稿:丁美荣