神经机器翻译前沿进展

自然语言处理与智能软件技术研究团队

更多动态

3885

2020-09-30

神经机器翻译前沿进展

【原文：刘洋《神经机器翻译前沿进展》-载于2017年2月“计算机研究与发展”第54卷第6期】

1. 背景

机器翻译研究如何利用计算机实现自然语言之间的自动转换，是人工智能和自然语言处理领域的重要研究方向之一。2006年，google translate推出统计机器翻译方法成为商业机器翻译系统的主流。2014年，端到端神经机器翻译获得了迅速发展，相对于统计机器翻译而言在翻译质量上获得显著提升。

2. 神经机器翻译

2.1编码器-解码器框架

端到端神经机器翻译的基本思想是通过神经网络直接实现自然语言之间的自动翻译。为此，神经机器翻译通常采用编码器－解码器（encode-decode）框架。如图2（文中原图）所示，给定一个中文句子“布什与沙龙举行了会谈”，编码器－解码器框架为每个中文词生成向量表示，通过一个递归神经网络（recurrent netural network）从左向右生成整个中文句子的向量表示。将源语言端所使用的递归神经网络称为编码器，即将源语言句子编码成一个稠密、连续的实数量。