• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

Android 语音 vs. Siri,谁才是语音强者?

公司

2013-08-21 12:22

在两个星期前的 Moto X 评测文章中,纽约时报的戴维·波格(David Pogue)说了一句,“Android 的语音指令仍然比不上 Siri。” 于是,他收到一封愤怒读者来信:“你的评测文章是我读过的最傻缺的。我极力避免用脏话来形容你的蠢。”

每一篇稿件纽约时报都会做事实审查,编辑甚至会进行改写以更加符合报纸的风格,然后才予以发布。有着这样严格的流程,至少可以说明波格的这句话不是随意判断。

波格说,为了评测语音识别这个功能,在两个星期的时间里,他身上带着 iPhone 和 Android 手机,他同时向两部手机说话,体验其中的差别,双方各自的优势和劣势。对于读者这样的来信,他觉得,人一般在谈论语音识别的时候,他们常常弄混听写、命令以及搜索的区别。

听写,是指将听到的语音转化为文字。

波格经过测试发现,不论 iPhone 还是 Android 手机,在将语音转化为文字的时候都出了许多错。当人们把手机摔在一边说 “我放弃了” 的时候,通常都是在听写这部分遭遇到挫折。当然,要让手机识别出不同地方的人说话的口音,而且还要应对每个人在不同距离跟麦克风说话,以及不同程度的环境噪音,如此之高的要求之下,“听写” 表现不好是可以原谅的。

最新的 Android 版本有了离线语音包,可以在不联网的情况下,进行简单的语音识别。而且 Android 可以一边听,一边将写,而 Siri 则要等人说完以后才写出来。

Siri 对文书格式的支持比较完善,能够识别出 “大写”、“全部大写”,“不要空格” 等指令,还认得出标点符号,包括 “冒号”、“破折号”、“星号” 还有 “省略号” 等等。而 Android 只识别基本的符号,比如 “句号”、“逗号” 和 “感叹号”。

命令,是指通过语音来操作手机。

语音命令能提供便利,比如说打开某个应用的时候,不必翻翻找找;而设置闹钟的时候,也不必进入到闹钟应用,打开复杂的设置选项,点击好十几次屏幕才完成操作。波格称,这是 Siri 取得优势的领域。比如说在开车的时候,当有短信来的时候,可以直接命令它读出来。读完之后,Siri 甚至会询问是否回复,这样人们就不必将视线从道路转移到手机。而 Android 做不到这一点。

搜索,提供网络相关信息。

在这一部分,Android 则超出 Siri 许多。虽然两者都提供了诸如天气、股票、运动等信息,还提供了单位换算、计算器等功能,以及常见的网络搜索索引。但是,因为 Google 的招牌就是网络搜索,因此 Android 当遇到 “搜索” 的情形时,反应十分、十分迅速,超出 Siri 许多。

Android 最爽的是,不必拿起手机就能呼叫和导航。比如说,“打电话给第 34 街的 Macy”,或者 “获取 La Guardia 机场的公共交通路线”。不必说,Google Maps 的质量杠杠的。此外,Android 的上下文理解也不错,如果第一个问题是问,“谁是希拉里·克林顿?”,那么第一个问题会是 “谁是她的丈夫?”

此外,Android 内置了类似 Shamzam 的音乐识别功能,直接点击语音识别按钮,然后让它听正在播放的音乐,就能识别到这首歌曲是什么,歌手是谁。

比较遗憾的是,Android 的语音识别功能不是全局通用——要用的时候,只能点击 Google 搜索栏旁边的 “麦克风” 图表,或者 Google Now 界面中。这限制了 Android 在语音方面的发挥,人们无法在锁屏的状态、或者在别的应用中使用语音功能。换言之,除了 Moto X 以外,要使用别的 Android 手机的语音功能,就必须不断的拿起和放下手机。

因为与 OpenTable 合作,所以通过 Siri,人们可以直接订酒店、电影票等等。此外,Siri 对自然语言的理解比较到位。如果问 “这个星期有什么电影?”,“给我看《The Way,Way Back》的评论” 这样的问题,SIri 可以正确理解,并给出相关的信息。而 Android 的话,就仅仅会在网络上搜索而已。

另外,Siri 有幽默感,而 Android 没有。我们可以对着它开玩笑。

以上就是波格用两个星期亲身体验,得到的 Android 与 Siri 的对比。从 Siri 发布到现在,它已经有了长足的进步,Google 在语音方面也积累了大量的经验,语音识别的精度与速度都在不断提高。随着未来这两个语音引擎逐渐成熟,它们将为我们的生活带来更多的便利。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中