为了重建巴别塔,Google 最近挺努力的

产品

2018-10-16 12:12

为了重建巴别塔,让人类可以更突破语言障碍与全球实现互联,Google 最近在翻译方面的更新很努力。

▲ Google Pixel Buds

首先,Google 的无线耳机 Pixel Buds 宣布,其独有的翻译功能,将向全体支持 Google Assistant 的耳机开放。

这意味着,BOSE QuietComfort 35 II、索尼 WH-1000XM3,还有 JBL 一系列支持 Google Assistant 的产品,获得翻译这个技能点后,都将在我们的耳边摇身一变成为翻译器。

▲ Google Pixel Buds 翻译功能的语言支持

这个功能支持 40 种语言的实时对话翻译,带上耳机后通过耳机呼出 Google Assistant,并对其说「翻译」就能使用。

国内使用支持 Google Assistant 产品的用户应该不算多,但使用「Google 翻译」这个 app 的用户一定不少。

「Google 翻译」宣布从 10 月中旬开始,相机翻译功能将陆续新增支持 13 种语言,分别为阿拉伯语、泰语、越南语、印地语、孟加拉语、古吉拉特语、卡纳达语、马拉雅拉姆语、马拉地语、尼泊尔语、旁遮普语、泰米尔语和泰卢固语。

本次更新后,「Google 翻译」的相机翻译功能将支持 50 种语言,iOS 和 Android 系统的用户都可以获得更新。

「Google 翻译」背后最大的功臣就是机器学习。相机翻译中就有两个步骤需要应用人工智能。

首先,在相机对准需要翻译的文字后,Google 翻译会使用光学字符识别技术,对图像上的字母和字符进行识别。光学字符识别技术是一种将图像上的字母转换为数据的机器学习系统。

随后,神经网络机器翻译系统将识别到的文本,翻译成目标语言自然发音的词句。光学字符识别技术和神经网络机器翻译系统,两个都是 Google 在人工智能领域的拿手好菜。

2017 年 3 月底,最新版的「Google 翻译」终于在中国大陆可用,然而其实从 2016 年 9 月开始,Google 翻译的中英互译就正式启用了神经网络机器翻译技术。

今年 6 月 Google 宣布,在 iOS 以及 Android 的「Google 翻译」上加入离线神经网络机器翻译(NMT,Neural Machine Translation),也就是说,下载了离线的资源包后,在没有网络的情况下,Google 翻译不会逐个词语地生硬翻译,而是逐渐学习去说人话。

我们还曾让 Google 翻译分别在联网、离线没有 NMT、离线拥有 NMT 的三种情况,对古诗词、新闻报道、经典台词以及日常用语,进行了多个回合的翻译能力对比

▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT

比如翻译 6 月 14 日新华社文章《5 月份主要数据反映中国经济运行稳健》的第一段:「国家统计局 14 日发布的数据显示,5 月份,国民经济继续保持总体平稳、稳中向好发展态势,生产需求基本平稳,就业持续向好。」

  • 联网时的翻译是:基本没有语法错误。
  • 没有更新 NMT 前的离线翻译是:逐字翻译无疑,「14 日」翻译有误,语法错误明显。
  • 更新 NMT 后的离线翻译是:「五月份」这个翻译有误,离线情况下也有使用句子的方式来翻译。

得出结论:联网的 Google 翻译准确度依然是比较高的;离线情况下,就算加入了 NMT 解决了逐字翻译的问题,用句子的方式来表达,但依然距离信达雅还有一定的距离。

目前而言,同传翻译员的饭碗还是很稳的。加入人工智能技术多年的「Google 翻译」,不知道它的翻译能力,会不会遵守摩尔定律呢?

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中