下载客户端
下载客户端
关于我们 寻求报道 加入我们
产品 2016-1-07 11:12

利用图像识别,这个 App 想成为视力受损用户另一双眼睛

智能设备的发展,使得我们有了很多以前从未有过的感知世界的方式。而对于残障人士来说,这些新技术就像传播学大师麦克卢汉所言,成为他们“人体的延伸”,帮助他们过上更加便利的生活。一个名为 BlindTool 的 Android 应用,就通过图像识别的方式,让视力受损的用户能够更方便地“看”到这个世界。

(优酷视频链接)

BlindTool 的开发者 Joseph Paul Cohen 是麻省大学波士顿校区的一位博士。App 的使用非常简单,用户只要将手机摄像头对着物品,它就能够进行识别并且用语音播报出来。听起来,这个 App 还真的像一双眼睛。

几年前我和一位盲人程序员一起工作,这让我开始关注到视力受损人群的需求。我当时有一个想法,就是通过某种技术来帮助他们“看见”这个世界,但是那时候还未能实现。

而现在,图片识别技术已经发展到一个新的高度,之前爱范儿的副主编就曾利用 Google 来找出奇葩的 12306 验证码答案。微软在今年也公布一项里程碑式的成果:它的图像系统识别图片的错误率比人类还要低。

不过这些技术的背后,需要的是强大的计算机或者云端服务的支持。对于 BlindTool 这种自成一体的小应用来说,这并不现实。于是在 BlindTool 中,测试图片的种类仅有 1000 种(与之相比,最先进图片识别系统图片类别数是 37000)。

Cohen 解释,这样做可以保证图片识别的速度。“就算只是 5 秒钟,都会让我对它很心烦”。经过优化,现在 BlindTool 已经可以做到在 1 秒内完成识别和播报了。

app

不过这同时带来了一个严重问题:识别不准确。BlindTool 目前的解决方法是只有确定度在 30% 以上才会有语音播报,而如果十分肯定——即 90% 以上则会有震动反馈。

虽然有人不断吐嘈互联网和新技术带来的负面影响,但不可否认的是,对于少数人群,它们带来的是生活上翻天覆地的变化。

题图来自:nytimes

插图来自:fastcodesign

有好的产品或者项目希望我们报道,猛戳这里 寻求报道

文章评论(-)
后参与讨论
正在加载中

【CES】戴尔发布全新 4K 显示器,炫技和可用的地方不算少

2016-1-07 13:59下一篇

【CES】三星已经开启炫技模式,一个屏幕分成 8 块满墙跑

2016-1-07 10:53上一篇