Google 图像识别 AI 眼中的世界是怎样的?
Google 在 2015 I/O 大会上推出的 Google Photos 不仅仅是一个相册,它可以将相册中同一个人物的照片整合在一起,比如回顾一个婴儿从小到大的成长轨迹。通过人工智能的长期学习,它甚至可以自动判断对你重要的时刻、重要的人、和重要的事物。
在其中起到关键作用的是 Google 的图片识别 AI 。它通过学习大量的图片、调整算法来提高识别的精确度。
但是工程师们要如何知道 AI 对图片识别的准确性呢?
通过一个被称为 Inceptionism 的项目,Google 工程师潜入了 AI 的 “梦境”。他们先输入一张图片,让它识别图片中关键的部分;再让 AI 输出一张图片,表达它对图片的理解。
Google 的图片识别 AI 具有 30 层神经网络,每一层对应着不同的抽象程度,比如最低层次能识别光线、色彩,下一层次能识别图片的边缘等等。这样一层层的“训练”需要大量的数据。每一层都能提取出更高层次的细节,而最后一层会决定 AI 对图片的理解。
比如你想知道输入怎样的图片会让 AI 认为是“香蕉”,可以从一张满是噪点的图片开始,然后慢慢调整,直到它输出你想让它识别的事物。
在测试中,当试图询问哑铃是什么时,Google AI 输出了带手臂的哑铃,在输入学习的图片库中,哑铃都是和手臂一起出现的。那么提高认识精确度的办法就是,在训练学习中多输入一些哑铃单独出现的图片。
在不同的层次输入图片会得出不同的结果,比如在一些测试中,就出现了这些多眼多足的“神兽”。
Google 还专门为这些图片建了一个相册。有的如同超现实主义的艺术作品,有的则十分惊悚。这些图片至少能够表明,AI 眼中的世界显然与人类还有很大的差距。
而用户对此的反应也不一而足。有人看了以后评论道:
“这是我见过最恐怖的东西。如果 AI 眼中的世界是我们永远都不可能看到的,那么我们要怎么回应它们的行为?”
而另一位用户则认为:
“我很怀疑这是我们可以称为‘智能’的东西。它很奇特、吸引人、很酷,但是计算机并不是在绘画或者做梦,它只是在遵循设定的程序而已。”
题图和插图来自:Google