微软亚研创新日前沿技术探营:实时语音翻译、Kinect 手语翻译
在微软亚洲研究院十五周年的纪念活动上,微软亚研院长洪小文以一幅九宫格数字图讲述了研究院过去十五载的故事。作为微软公司在美国本土以外最大的基础研究机构,微软亚研通过一些前瞻性的基础性研究、产品来推动技术转移,融入微软产品,支持公司战略。
在昨天的活动现场,我们亲身体验了一些前瞻性技术和产品,包括大数据与机器学习、云计算与移动技术、自然用户界面以及科技引领产品创新等等。它们尚未转化为商用技术,但从中我们可以一窥未来技术生活的图景。
实时语音翻译系统
现场展示了微软实时语音翻译系统,系统可以将用户所说的话翻译成另一种语言并通过语音播放出来,此外,它可以保留用户说话时具有的口音、音色和语调,尽可能地还原说话者的声音。目前,这种方法可以实现微软语音平台支持的所有 26 种语言间的互译。
现场演示虽然出现一些翻译错误,但基本上实现了简单沟通的目的。我们了解到,使用这种语音翻译软件,用户需要进行约一个小时的训练,为自己的语音建立一个模式,并与微软的标准文字-语音模式融为一体,用于对目标语言的翻译。
(Youku)
基于 Kinect 的手语翻译系统:与听障人士自由对话
洪小文在现场重点展示了“基于 Kinect 的手语翻译系统”。这套系统借助了 Kinect 体感设备捕捉色彩和深度图像信息,对手语进行识别和翻译,可以同时对汉语手语和英语手语进行识别与翻译,并通过语音反馈出来。
除此之外,系统可以将文本信息反向翻译为手语,从而实现与听障人士的正常沟通。
(Youku)
用大数据推断空气质量
当代都市人群对居住的生活环境越发关注,然而特别在大城市,不同地点的空气质量差异很大,而目前人们只能借助城市布局的有限的监测站进行判断,想要随时了解身边的空气质量几乎不可能。
在展示区,我们看到了这样一套可以实时推断城市任一地点空气质量的系统,它运用数据挖掘和机器学习技术,对大数据进行充分利用,在监测信息和对应结果之间建立一个隐式的映射,从而实时推断出任一地点的空气质量数据。
据工作人员介绍,这一系统的数据来源包括气象状况、交通流量、人员流动趋向、路网结构以及人口集中点等等。
开发人员还为改系统开发了一款 Windows Phone 应用,除了显示当前所在位置的空气质量指数,用户可以自由在手机地图中选点,并以可视化的方式呈现出来。
Power Map:让 Excel 的数据活起来
在 Excel 中,用户可以借助 2D 图表功能,将数据转化为饼图、条形图等可视化形式,便于 PPT 演示。在展示区,我们看到了一款将 Excel 数据转化为 3D 的可视化工具。
现场以 2008 年奥运会中国奖牌信息统计表为例,不同省份的奖牌数、奖牌种类可以通过 3D 柱形图映射到地图上,
洪小文表示,这一技术已经进入到 beta 阶段,相信不久就可以作为 3D 数据可视化的工具融入到 Excel 之中。