我们用李白测试了下新版的 Google 翻译

生活

2018-06-14 16:30

去年 3 月,Google 翻译成为我们目前在国内可以正常使用的 Google 应用。现在这个 App 又有新变化,要变得更好用了。

近日 Google 宣布,将在 iOS 以及 Android 的 Google 翻译软件上加入离线神经网络机器翻译(NMT,Neural Machine Translation),也就是说,下载了离线的资源包后,在没有网络的情况先下,Google 翻译也会说人话啦,而不是逐个词语地生硬翻译。

这次 Google 翻译提供了包括中文在内 59 种语言的离线翻译包。我们选择下载了中文翻译离线包,同时找了一些英文语段,试了在联网以及离线的情况下,翻译有哪些变化。

加入了 NMT 的 Google 翻译,真的变聪明了吗?

不知道你之前是否发现,在联网和离线的情况下,用 Google 翻译出来语句是有差异的?那是因为在不同的平台,Google 使用了不同的翻译技术。

因此我让 Google 翻译分别在联网、离线没有 NMT、离线拥有 NMT 的三种情况,对古诗词、新闻报道、经典台词以及日常用语,进行了四个回合的翻译能力对比。从信达雅的角度进行打分,满分为 5 分。

同时将它们翻译出来的内容,放在网页版的 Google 翻译中,看是否能够还原翻译前的意思。

第一回合:翻译李白的一句古诗

比如我找到了李白《将进酒》中的这一句用来翻译:「君不见,黄河之水天上来,奔流到海不复回。」

▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT

联网时的翻译是:

Do not you see, the waters of the Yellow River come to heaven, running to the sea will not return.

点评:满分 5 分,得分为 4 分。因为意思相对完整,「黄河」的翻译首字母都用上了大写,真是细致,依然有语法错误,相对浅显易懂。

没有更新 NMT 前的离线翻译是:

Do not you see, yellow River water heaven, torrent to sea not re-back.

点评:真的是逐字翻译,语法错误明显。 2 分。

更新 NMT 后的离线翻译是:

Junski, the yellow river on the day, run to the sea is not replicated.

点评:Google 翻译的人工智能,把「君不见」识别为一个人名,并且翻译成了「Junski」。语法错误明显,曲解诗句原意。1.5 分。

这一回合,只有联网时的翻译可以还原翻以前的意思。

第二回合:翻译新华社的一段新闻

我找到了新华社 6 月 14 日,一篇题目为《5 月份主要数据反映中国经济运行稳健》的第一段:「国家统计局 14 日发布的数据显示,5 月份,国民经济继续保持总体平稳、稳中向好发展态势,生产需求基本平稳,就业持续向好。」

▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT

联网时的翻译是:基本没有语法错误。5 分。

没有更新 NMT 前的离线翻译是:逐字翻译无疑,「14 日」翻译有误,语法错误明显。 2 分。

更新 NMT 后的离线翻译是:「五月份」这个翻译有误,离线情况下也有使用句子的方式来翻译。3 分。

▲ 使用离线 NMT 翻译的语句,第一个分句在还原时有误

这一回合,最后在网页版的 Google 翻译中,对这三段英文译文进行还原时,前两个都能还原出句子原来的意思,但是使用离线 NMT 翻译的语句,第一个分句不能并被网页版的 Google 翻译正确还原。

第三回合:翻译一句简单的美剧台词

《神探夏洛克》第一季第一集里,有一句经典的台词:「You, don’t talk out loud. You lower the IQ of the whole street. You, face the other way. You are putting me off. 」

▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT

联网时的翻译是:

你,不要大声说话。你降低了整条街道的智商。你,面对另一种方式。你让我失望。

点评:4 分。结构整齐,但有一个分句翻译出错。

没有更新 NMT 前的离线翻译是:

你,不说话出声来。您降低 iq 的整个街。你,脸的其他方式。你是把我关闭。

点评:1 分。这一句的翻译,简直是拉低了 Google 的智商。

更新 NMT 后的离线翻译是:

你不要喊出大声。 你降低整个街道的智商。 你面对另一方面。 你把我放在了

点评: 2 分。前半部分翻译正确。但是后一部分就不行了,最后话说到一半就结束了,你想学习人类的欲言又止吗?

这一回合的结论是,在不联网的情况下,Google 翻译都拉低了 Google AI 的智商。

第四回合:翻译一句生活日常用语

「游泳健身,了解一下。」

▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT

联网时的翻译是:

Swim up and learn about it .

没有更新 NMT 前的离线翻译是:

Swimming fitness, look.

更新 NMT 后的离线翻译是:

Swimming fitness and understands.

这一回合,联网时的翻译罕见地出现了较大的偏差。在网页版 Google 翻译上还原的时候,只有第二种情况,没有更新 NMT 的离线翻译能够准确还原。

总结

总而言之,Google 翻译作为一种工具,为我们平常的生活、学习提供了很大的便利。离线情况下,就算加入了 NMT,解决了逐字翻译的问题,用句子的方式来表达,但依然距离信达雅还有一定的距离。

联网的 Google 翻译,准确度依然是比较高的。还有就是,我们依然需要努力学习英文,不能太过依赖机器的翻译,因为它们依然还没有到达非常可靠的程度。

AlphaGo 神经网络早在两年前开始应用于 Google 翻译,人工智能对人类语言识别依然在快速发展。对于目前手机的性能而言,将人工智能装进移动设备,无论是硬件还是软件,挑战还是蛮大的。

这次 Google 将深度学习的模型压缩到了普通智能手机可以承受的范围内,我们这次发现,每种语言的离线压缩包,大小都在 40-50 MB 左右。

 

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中