• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

在这个地方里搜索表情,会有奇迹发生 | MindStore

产品

2016-04-15 10:33

有时候看着一张照片,盯久了,脑袋会突然卡壳,辨认不出照片里面是什么东西,每当遇到这种情况的时候,我想我内心是崩溃的。

可这样的烦恼,我想也许以后就不存在了,MindStore 分享了一个由微软推出的智能图像识别机器人 CaptionBot,可以像人类一样识别并且能够描述图片的内容。除了能够告诉我图片中的物体是什么,还能让我知道它正在做什么。

CaptionBot 的出现主要是微软为了展示其通过多年的研究成果,特意推出的微软认知服务(Microsoft Cognitive Services)。确切地说,CaptionBot 由计算机视觉 API、人工情感 API 和必应图像搜索 API 等三个部分组成。

不可思议的辨认识别度

1

我们可以发现 CaptionBot 网站本身有提供六张图片作为测试,只是想尝尝鲜的人只要轻点其中一张图片,不久就会出现分析结果。

cookie

CaptionBot 识别的准确度比想象中要高很多,不仅仅能识别出图片中的物体是三明治,还知道它是被切成两块的三明治。在三明治的下面,我们还可以为识别的结果打分,根据评分来判断识别结果的正确性。

也许随着评分人数的增加,CaptionBot 的深度学习系统使其智能识别准确度越来越高。

当然,像我这种具备强烈好奇心的人,自然不会忽略页面下面的“Upload a photo”的字眼。CaptionBot 提供由本地上传和图片链接等两种图片上传的方式,操作方式跟平时使用的一样,按提示一步步完成即可。

3

有时候 CaptionBot 充满人性化的语气真是让人忍俊不禁。

howoldnet2

实际上 CaptionBot 的出现,让我想起微软在 2015 年开发者大会上,用来展示自家人脸识别 API 的网站 How-Old.net,用户只要上传照片,系统就会自动判断你的性别和年龄。

当时这个产品在国内外的社交平台上都火了一圈,不知道大家还记不记得,当时的朋友圈几乎每张照片上,每个人的脸都被方框框住,每个方框上面都飘着一个数字,说不定 CaptionBot 就是下一个转疯朋友圈的 How-Old.net.

image

当时每个人都以年龄数字小为荣,可有一个诡异的事件不知道大家有没有发现。大家可以观察一下上面这张图片,然后在评论区给我留言发现了什么。

他们的“第三只眼睛”

CaptionBot,是微软在其图像识别等领域取得的成果的展现, 目前它可能仅仅只是作为一个小测试,识别某张图片的内容。

我在刚打开这个网站的时候,心里也是嘀咕着说:“这玩意儿有什么用啊?不就是识别图片嘛。”

没错,对于普通人来说,CaptionBot 可能仅仅是在社交媒体上充当一个玩具的作用,我利用这样一个玩具达到我娱乐和社交的目的,这样就完了,也没有后面的东西了,也许仅仅是两三天后我就已经忘记这样一个网站的存在了。

blind

可是仔细想一想,对于盲人等一些有缺陷的人来说,这可能就是打开新世界的大门了。假如一个盲人戴着装有能实现 CaptionBot 功能的 Google Glass 出门,任何图像内容能够被智能识别并且转化为语音,那盲人是否也能通过这样的“第三只眼”来“看到”这个世界了?

期待这一天的到来。

题图来自:unsplash

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中