AlphaGo 神经网络应用于 Google 翻译,将接近人类水平
那个支持 AlphaGo 赢得围棋比赛的深度神经网络如今又要有新的表现,Google 即将把它应用于 Google 翻译中,让机器翻译更加通顺流畅,表意清晰。目前该系统仅应用于中文到英文的语言对翻译。
Google 表示,新的翻译系统简称为 Google 神经机器翻译(Google Neural Machine Translation-GNMT),就某些语言而言,GNMT 错误率可以减少 60%。
人类翻译、神经机器翻译系统和短语单词翻译系统的完整度(分成 0~6 的程度)在不同语言应用中的对比
该项目的负责人之一,同时也是 Google 智库成员的工程师 Mike Schuster 谈到:
我们将按照 “端到端” 的模式对整个系统进行统一训练,这可以使公司更专注于减少翻译的错误率方面。虽然现在还并不完美,但的的确确是完善了很多。
新的神经机器翻译系统如何检测一个句子,并对它之间的关联性和重要性进行考量
在机器翻译方面,Google 使用的深度神经网络叫做 LSTM(long short-term memory – 长期短期记忆)。LSTM 可以保留长期和短期的记忆,有点像人类的大脑,这使得它可以用更复杂的方式进行学习。
和 Google 以前的短语翻译系统(Phrase-Based Machine Translation-PBMT)不同,LSTM 可以从头到尾记住一句话再进行翻译,使长句翻译不再是单词的拼凑,而是流畅通顺的语言。
一句中文在短语单词翻译系统、神经机器翻译系统和人类翻译的区别
其实多年以来,Google 一直想让 LSTM 服务于翻译工作,然而一直无法攻克翻译速度这个难题。直到做了大量的工程和算法工作,才得以完善这个模型,让新神经机器翻译系统能够在跨越大型的 Internet 服务时保持工作速度。
Google 还计划利用新系统推出 10000 多个语言对的机器翻译。
以上图片均来自:googleblog ,题图来源:vertexreport