梦想有多大,感知计算就有多好玩

公司

2013-04-10 19:50

邓慕理(Mooly Eden)在寻找对感知计算最直接的定义。作为英特尔高级副总裁兼感知计算业务总经理,慕理一年多前就做出大胆的想象,通过渲染技术,用视频将英特尔对于感知计算的梦想概念化。而今,这种大胆想象在追梦人的努力下,已初具雏形。

什么是感知计算呢?慕理的理解是:Natural(自然)+Intuitive(直观)=NI(你)——当然,这是他为了这次在中国的演讲而精心准备的桥段。感知计算的第三个关键词是 Immersive(身临其境)。

怎么理解这三个词呢?当慕理第一次看到那段牛蛙 “捕虫” 的 YouTube 视频后,他捧腹大笑,多次观看后,他觉得这就是感知计算应该达到的效果:不需要说明书,十分直观,让人自然而然地反应,身临其境。

在过去五年,感知计算的发展,在语音方面有 Siri,在视觉方面有 S3D、体感外设、智能电视、视网膜显示技术,感官方面有电话/平板触控、传感器、Win 8 触控优先。而在未来,仅情境这一方面,增强现实、多模态化、私人助理都值得期待。

在 IDF 的整个演讲过程中,慕理一直吐槽翻译,担心翻译没把他的意思翻正确。他希望未来能实现 “实时翻译”,这样他所讲的可以立刻变成中文,这样大家的 “哇” 和笑声就可以紧跟他的演讲。

去年 10 月,英特尔推出了 Perceptual Computing 感知计算软件 SDK,涵盖了感知计算的多个方面,如面部识别、语音指令和手势识别。该 SDK 包括一个程序,使开发人员可以轻松使用 Creative 的 Interactive Gesture 摄像头。随着第四代酷睿处理器的推出,和 3D 摄像头的应用,这些感知计算功能得以实现。

慕理就展示了英特尔跟 Nuance 合作开发的 Dragon Assistant(声龙助理)。在现场演示中,我们发现:英文的识别率要比中文高很多,这是因为目前软件为 Dragon 1.0 版本,未来 1.5 版本将适用于 27 个国家 9 种语言,包括慕理一直讲不好的 “辣子鸡”:中文。除此之外,这套语音识别软件还能逐渐学习,识别口音。

慕理认为触屏终将替代键盘,而语音将替代触屏,这并不意味着触屏会消失,而是使用数量会下降。

游戏行业是动态追踪和手势控制的早期采用者。现场也演示了用这套 SDK 所开发的游戏。如用户可以跟猴子玩石头、剪刀、布,可以控制猴子模仿自己的表情。慕理则亲自演示了如何像上帝一样创造宇宙,以及合成手。

yuzhou

除了游戏外,内容创建也将是这项技术的重要运用。 Perceptual Computing 可以将被摄者的身躯部分裁剪出来,搭配别的布景,从而可达到视频制作的效果,如下图中慕理所 “主持” 的体育节目。同时,在双人远程协助中,这项技术也可以实现两人直接在窗口内活动。

jjj

要做到身临其境,慕理认为 “最后,我们无法识别真实世界与虚拟世界”。他拿起一本特制的图书,打开后,摄像头识别出上面的蝴蝶,蝴蝶便在屏幕上实现 3D 动画,翩翩起舞。

ttt

下午,我也参观了展区的演示。其中,便有曾在英特尔感知计算挑战赛第一阶段获奖的中国团队:JOY。通过双手在摄像头前改变手势、距离、深度、高度等,不同音乐元素和视觉效果会随之变化,它是一种全新定义的乐器演奏方式。另外一个团队,音视技术,则利用实时渲染技术,实现动画制作方面的创新。

hhh

目前,这个挑战赛进入第二阶段,从现在开始到 9 月 13 日结束,奖金超过 80 万美元。有兴趣的团队可以试试。

 

爱范儿视频号
登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中

我最怀念的,不是那些终将消逝的东西, 而是鸟鸣时的那种宁静。

本篇来自栏目

解锁订阅模式,获得更多专属优质内容