Wit.ai:声控智能家居不再遥远
最近几年,科幻电影不断推陈出新,展现了未来众多可能的情景,而它们在电影中提出如何运用科技的方式,也给硬件创业者诸多想象。从汤姆·汉克斯的《少数派报告》,到小罗伯特·唐尼的《钢铁侠 3》,再到斯嘉丽·约翰逊的《Her》,你会发现语音交互的比例越来越高。
《少数派报告》的场景虽然科幻,然而需要人不断抬起手滑动来滑动去的方式,其实很累;《钢铁侠 3》中,钢铁侠主要用语音来下命令,而用手势进行细微的操作;至于《Her》,语音占据交互的整体部分,手机则是用于展示图片、视频,用于定位和拍照。
最近我接触不少硬件创业者,相当有趣的是,他们对语音的兴趣越来越高。经过了解则发现,他们的观点是这样的:在交互上,越不花费人精力的方式,会越好。所以比起手势,会更加看好声音在交互上的作用,毕竟语音交互只需要人动动嘴皮子而已。
但是,若让创业团队自己从头做一个语音识别功能,费钱费力不说,效果是不是达到预期也是未知数。MIT Technology Review 最近报道了国外一个创业项目 Wit.ai,则是希望能够为硬件创业者提供一个语音命令的框架,让后者的产品当中,轻易集成语音控制的功能。
公司创始人 Alex Lebrun 此前创立另外一家公司叫 VirtuOz,为 eBay 和 AT&T 开发类似 Siri 一样的声控软件。因此有相关的技术背景。
Wit.ai 称开发者只需要 3 步,即可把语音识别功能集成到产品里。第一步,上传设定自己需要的语音命令,第二部,调用 Wit.ai 的 API,输入音频得到结果,第三步,让 WIt.ai 进行学习,并改进识别精度。——换言之,语音会发送到 Wit.ai 的服务器,然后服务器向应用返回结构化的数据。
对于 Wit.ai 来说,其实做到语音识别不难,但难在如何让各个平台的开发者,都能利用到 Wit.ai 的 API 接口。实际上,Wit.ai 做了不少准备,查看开发文档可知道,它已经兼容 Web、iOS、Android、Node.js、Raspberry Pi、Ruby、Python、C 和 Rust 等不同的版本。
滑铁卢大学的学生 Nick Mostowich 上个月参加了校内黑客马拉松,他以及团队成员利用 Wit.ai 为他智能微波炉产品添加语音控制功能。他说,他们很快就添加了一系列和食谱有关的指令,这样用户在说“给我做点培根”,然后微波炉就会启动,然后设定好合适的火力和时间。
在国内,科大讯飞 8 月份发布了面向智能家居领域的语音产品,但主要合作方是传统电视厂商创维、长虹、海信、TCL、康佳、海尔、迈乐机顶盒等。
题图来自 softmart