华为诺亚方舟实验室李航:迎接自然语言处理新时代

华为诺亚方舟实验室李航:迎接自然语言处理新时代

 

 2017年2月,华为技术有限公司诺亚方舟实验室主任李航博士在“中国计算机学会通讯”第13卷第2期发表了一篇文章,标题为《迎接自然语言处理新时代》。该文章从语言的不完全规则性、递归性、比喻性、知识关联性、交互性出发,讨论为什么让计算机理解人类语言是极其困难的,提出自然语言处理研究应该采取的策略

图1 李航博士在中国计算机学会通讯上发表文章

 让机器人理解人类语言的意思,一直是人工智能领域的一道难题,而对“理解”本身也有不同意义上的定义。当你听到一个人的名字时,脑海中会浮现这个人的印象,这是概念上的理解。而当你被请求或是命令时,你完成了要求,那么对发令者来说就是你理解了他的话。李航在文章中指出,前者是基于表示的理解,后者则是基于行动的理解。

图2 通过语言让机器人扫地,若能正确执行,就认为机器人理解

自然语言理解是十分困难的,但人类通常忽视理解的困难性,主要原因还是人类对自身的语言理解功能并没有一个深刻认识。再者,人类对语言的理解还深受环境影响,李航在文章中用脑科学家赫尔德(Richard Held)和海恩(Alan Hein)做的主动猫与被动猫的实验为我们说明了环境交互对智能体的重要性。

图3 主动猫与被动猫的实验

主动猫与被动猫实验介绍:图2实验中A猫为主动猫,主动猫的脚能着地,P猫为被动猫,被动猫被放在篮子里无法行走,主动猫走动时,转马旋转带动被动猫跟着转动。白天把两猫放在转马上,晚上放到黑暗处吃睡,如此两个月以后,将它们放出去。可以发现主动猫可以正常行走,但被动猫已经失去了行走能力。实验说明了先天能力如果不在环境交互中使用将可能丧失,而语言理解能力也一样。

 

对于计算机来说,自然语言理解是十分困难的,但自然语言处理却是完全可以实现的。

       自然语言处理技术的强大动力:任务驱动与混合模式

任务驱动:基于具体应用构建系统。在人工智能系统中,用户对系统的使用产生大量数据,机器学习算法基于数据来构建模型,用于优化系统,系统优化后又更好服务用户,从而形成一个闭环。在图4这个闭环中,人工智能系统不断改进。自然语言处理也可以遵循这个规律发展,确定任务能更好更高效地驱动技术的发展。

 

图4 李航博士在文章中使用的“人工智能闭环”图 

混合模式,结合统计,规则,深度学习方法产生更强大的技术。在未来,自然语言处理的发展必将结合多种方法,有效运用各种方法的优点,以诞生更强大自然语言处理技术。 


         

         李航  CCF专业会员,CCCF特邀特邀专栏专家。华为技术有限公司诺亚方舟实验室主任。主要研究方向为信息检索、自然语言处理、机器学习等。

HangLi.HL@huawei.com

 

撰稿:蔡剑

审稿:丁美荣



登录用户可以查看和发表评论, 请前往  登录 或  注册
SCHOLAT.com 学者网
免责声明 | 关于我们 | 用户反馈
联系我们: