苹果渐弃 Nuance,利用神经网络打造自主语音技术

公司

2014-07-02 11:31

早在 Siri 刚发布的时候,Siri 的一个 Co-Founder Norman Winarsky 接受 9to5Mac 的采访时说道:“语音识别在 Siri 中所占的分量,比大多数人想象的要少得多。目前 Siri 用的是 Nuance 的技术。但是一旦有更好地语音识别技术出现, Siri 可以很容易更换一个新的”。

现在 Wired 带来的消息是,苹果正在着手更换掉 Nuance,打算用自己研发的语音识别技术,最快可能在 iOS 9 中亮相。

Google 和微软都有自己的语音识别技术,并应用于 Google Now 和 Cortana,如今苹果也终于要完成这一步。第三方的技术虽然很容易找到业界最好的,但毕竟是别人家的公司,哪天关闭了也说不定,前段时间就传出三星打算收购 Nuance 呢。

在过去几年,苹果不仅吸纳了 Siri 的语音技术人才,更是将 Nuane 公司的多名高级语音研究人员挖角过来,包括了前研发副总裁 Larry Gillick,以及来自微软语音识别项目高管 Alex Acero,后者在微软工作达 20 年之久。

Siri 的许多智能操作依靠整合大量网络服务 APIs 来完成,包括 OpenTable Tickets.com 等,更重要的是,它还整合了 Wolfram Alpha 智能搜索引擎,后者因 “直接提供最佳解决方案而非链接” 的设计初衷而被许多评论家称为 “Google 杀手” 并寄予厚望,这也是 Siri 可以回答结构性知识的原因,但这还不够,Siri 常常令人失望

为了进一步提高准确率,苹果打算利用神经网络来提升语音识别率,这是一种十分炫酷的技术,将机器学习的方式模仿人类大脑的神经元,当处理的话语越来越多时,这种网络就可以逐渐理解话语。实验结果发现,这种技术可使得精确度提升 25% 以上,这是一个巨大的飞跃,因为这个行业只需要提升 5% 就具备革命意义了。

目前 Google Now、Skype Translate 都采用了这种算法,微软研究部门主管 Peter Lee 认为,苹果大约花 6 个月可以赶上 Google 和微软。

 

题图来自 Time

后评论

评论在审核通过后将对所有人可见

正在加载中

关注科技,热血而沉着,极致而纯粹。努力做一个理想主义者。

本篇来自栏目

解锁订阅模式,获得更多专属优质内容