AI 的下一个目标是取代人工翻译,但表现令人大跌眼镜
AI 到底有多厉害?赢了世界高手就以为站在世界之巅?看起来路还很长啊……
最近,AI 在翻译领域频繁亮相,但比赛结果让人大跌眼镜。一边是全球最大搜索引擎的 Google,一边是地处亚洲的搜索引擎 Naver,双方各派出自家翻译软件,在翻译亚洲语言上好好 PK 了一场。本来以为占有地理优势的 Naver 会赢得这场比赛的胜利,但实际上和我们料想得差不多,人类的语言比机器理解高出得不是一个层级,“没有机器能够赢得这场与人类的比赛”。
PK 在汉语、英语、韩语之间展开,由两款翻译软件Google Translate 和 Papago 进行。 看看它们都翻译了哪些东西:
韩语中表达“一件很简单的事”,被 Google Translate 正确翻译成英文版本,但在英译韩的过程中被肢解成一个个的单词,本来对应的“It’s a piece of cake”成了“That thing is one cake piece ”,完全失去了内涵。
(Google Translate 版本:英译韩后变成“That thing is one cake piece ”意思)
(Papago 版本,第一个翻译正确,第二个错误)
本土应用 Papago 知道“It’s a piece of cake”的意思,但不能翻译成对应英语有点可惜。
第二轮中文上场,翻译的是中文中“十个胖子九个富”的表达,这句话就是说人有钱后就管不住嘴,结果只能身材走样。
在翻译中,无一例外谁都没答对,还出现了数字漏译和错译的问题。
(Papago 版本,第一个翻译完全不知所云,第二个直译也把“十”错误翻译成“一”)
Google Translate 表示完全理解不了中文在说什么,只好字面理解了。
终极 PK 落在了由类似词汇组成的句子上。一句“酱油工厂 Kang 领导,和大豆种植工厂Jang 领导”的韩语被翻译得乱七八糟,原来不止我们遇到这种翻译难题啊。
Google Translate 版本如上所示,把 Kang 理解成另一个意思“河流”,在多义之间没抓到正确的一个,之后错得更加离谱)
Papago 版本如下,虽然译对了核心词汇,但是在翻译整句时还是跌了跟头,没有翻译清楚原话。
亚洲语言的复杂程度,不仅弄昏了外国人,把翻译软件也搞糊涂了。韩国人还专门出了针对亚洲语言的翻译软件,很多跃跃欲试想利用本土化优势冲破目前机器翻译的藩篱也在赶来的路上。
这些年来人们利用可通读文章并分析文章脉络的互联网神经网络翻译 (NMT) 技术,肢解了语法对不同语言之间翻译造成的难题。但从实际情况来看,这仍旧是一块需要开发的领域。
Google Translate 已经意识到它对复杂语意的理解力依然有限,并将其设定为下一个攻破的目标。倒是 Naver,企图 Papago 能走在 Google Translate 前头。负责人曾经表示,与统计机器翻译相比,基于互联网神经网络的韩翻汉准确度提升了 160%,汉翻韩准确度提高 233%。
在 Papago 之后,Naver 又涉足更多的智能领域,研究室出品过一款适应用户使用环境的手机浏览器 Whale,接下来会搭载这款翻译软件,随后进入测试阶段。 同时,全球 10 亿用户使用的 Line 软件也出自这家公司,Naver 把翻译软件嵌入的可能性会比较大。这样一来,Papago 就好比坐上了大数据的快车,优化翻译的速度会递增。
上个月底在首尔举办的人机翻译大赛中人类获得了胜利,这给我们带来了短暂胜利快感的同时,也引发我们对机器翻译的重视。
但就目前来看,机器翻译技术并没有颠覆我们的认知,倒是方便了我们查单词。
图片来自:Forbes