AlphaGo 神经网络应用于 Google 翻译,将接近人类水平

公司

2016-09-28 15:34

那个支持 AlphaGo 赢得围棋比赛的深度神经网络如今又要有新的表现,Google 即将把它应用于 Google 翻译中,让机器翻译更加通顺流畅,表意清晰。目前该系统仅应用于中文到英文的语言对翻译。

Google 表示,新的翻译系统简称为 Google 神经机器翻译(Google Neural Machine Translation-GNMT),就某些语言而言,GNMT 错误率可以减少 60%。

3f3f3f3f

人类翻译、神经机器翻译系统和短语单词翻译系统的完整度(分成 0~6 的程度)在不同语言应用中的对比

该项目的负责人之一,同时也是 Google 智库成员的工程师 Mike Schuster 谈到:

我们将按照 “端到端” 的模式对整个系统进行统一训练,这可以使公司更专注于减少翻译的错误率方面。虽然现在还并不完美,但的的确确是完善了很多。

nmt-model-fast

新的神经机器翻译系统如何检测一个句子,并对它之间的关联性和重要性进行考量

在机器翻译方面,Google 使用的深度神经网络叫做 LSTM(long short-term memory – 长期短期记忆)。LSTM 可以保留长期和短期的记忆,有点像人类的大脑,这使得它可以用更复杂的方式进行学习。

和 Google 以前的短语翻译系统(Phrase-Based Machine Translation-PBMT)不同,LSTM 可以从头到尾记住一句话再进行翻译,使长句翻译不再是单词的拼凑,而是流畅通顺的语言。

img3

一句中文在短语单词翻译系统、神经机器翻译系统和人类翻译的区别

其实多年以来,Google 一直想让 LSTM 服务于翻译工作,然而一直无法攻克翻译速度这个难题。直到做了大量的工程和算法工作,才得以完善这个模型,让新神经机器翻译系统能够在跨越大型的 Internet 服务时保持工作速度。

Google 还计划利用新系统推出 10000 多个语言对的机器翻译。

 

以上图片均来自:googleblog ,题图来源:vertexreport

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中