动物 v.s. AI 奥运会：你会赌一只鸟还是机器人夺冠？

本文来自公众号 PingWest 品玩（ID：wepingwest），作者 Cactus，爱范儿经授权发布。

AI 能解决以前从未见过的任务吗？这场比赛正在测验这种事。

我们不得不面对AI的一个事实：如今的人工智能，其实智能的成分很少。在事先明确环境和问题的前提下，基于算法和大数据的深度学习，人工智能系统的确都能有不错的表现。

这就是为什么谷歌 AlphaGo 以 4:1 战胜围棋世界冠军、职业九段棋手李世石；汉森机器人索菲亚能对着你口吐莲花，以「就像活人的 AI」招牌狂言想要毁灭人类。

AI 研究的真实状态其实远远落后于我们所相信的技术神话。虽然大多数研究成果是真实的，但有很多是借助人工智能话题的炒作。

我们对于AI的最终梦想，是让机器拥有自主思考能力并非「培训考核」。

检查机器是否真的拥有智能，让机器通过图灵测试就可以，但直到今天图灵测试依然没有被突破，这或许是件好事也是件坏事。如果我们不以更健康的现实主义和怀疑态度对待人工智能，那么这个领域或许永远停留在车辙中。

近期刚拉开序幕的，由英国帝国理工学院和剑桥大学共同组织的「动物 vs AI奥运会」是一项有趣的竞赛实验。更有嚼头的是，就像组织者成员之一Matthew Crosby所说的那样，这场竞赛对于参与者和创办者都是不可控且极具颠覆的。

真正的竞赛，最终赛场布置只能「当天见」

较新的AI「培训课程」正在使用随机生成的环境进行测试和开发，正如这场「动物 vs AI 奥运会」。

竞赛组织已经公布大约50项关于动物的智能文献研究，参赛队伍即可根据公开的大量培训环境和对象进行AI动物智能体的「大脑」构建。

这是一个泛化的挑战，所以在训练测试中他们必须以不同的方式使用对象，同时也要使对象学会适应环境。挑战者们需要自己进行场景设置和互动，最终提交一个像动物一样进行食物猎取活动的智能体。

「这场比赛的重点是AI没见过的任务，所以最终比赛现场什么样，只有当天才知晓。」赛事组织者之一Matthew Crosby说。虽然不能对最终比赛进行「泄题」，但是在50项关于动物的智能文献研究中潜藏着一些有趣的例子供参赛者构建AI智能体的大脑。

▲模拟动物获得的智能体示例图

例如一个经典的实验，在动物面前倒置一些不透明的杯子，在其中一个杯子下放了一些食物，动物的任务是取回食物。起初每次都把食物放在A杯（相当于训练阶段），然而在最终比赛现场，这个食物会被放在B杯下。对于有些动物，比如黑猩猩，他们会直接选择B杯，但有些动物会选择A杯，因为他们通过记忆学习完成这项任务。

再例如一个从伊索寓言中汲取灵感得到的实验：一只乌鸦能学会叼起岩石投入水中，使水位上升到足够。但在实验中，可以设置既有岩石也有软木块的环境，乌鸦要学会选择岩石而不是软木塞投入水中。

「这些测试捕获了人工智能研究中很多被认为相当困难的元素，比如推广知识、转移学习、综合新信息、甚至可能创造性解决问题。参赛者们要面对大量不同环境的训练集，以应对最终未知的竞赛场景。」Matthew Crosby解释道。

▲乌鸦在面对水和沙子时能做出正确选择

「10项关卡」见分晓，AI想赢不容易

比赛共分为十个等级，测试是否成功取决目标实现程度。对大多数动物来说，能解决的是基础范围，只有少部分动物能解决的是困难且等级高的实验。

「觅食测试」是入门测试。可以考验AI智能体获取食物的能力，短时间能获取食物越多则越强。

「偏好测试」，则进一步考核智能体的则优能力。尽管对于不同动物来说会存在方式差异，但几乎所有动物都会用最简单高效的方法获得食物，其中有些动物对最有益的长期行为作出复杂的决定。

「障碍测试」、「弊害测试」、「空间推理测试」、」内部模型测试「，将从智能体的行动、规避风险、导航规划、视觉输入记忆上考研智能体的多项能力。

▲AI智能体也要面对和狗一样类似的障碍测试

「泛化测试」，这一级包括一些看起来与之前测试有所不同的环境，但解决方式还是一样的，不挑剔的智能体才有希望通关。

「物体存继性测试」，当一个物体从视野中消失，很多动物都能理解它依然存在的，这是人类认知范围能理解但AI不能的，如果不能理解这一特性，很多简单的人机交互就很难实现，开发者如何将这一点编制进AI将是竞赛一大亮点。

「高级偏好设置」，意味着智能体通过更复杂的决定获取更高级别的奖赏。

「因果推理测试」作为最终测试，希望看到智能体提前策划并在未实施之前就能预想到结果的能力。这种测试已经在一些动物身上得到验证。

如今这场虚拟奥运会比赛上线，奖金达到3.2万美金，比赛最终结果会在2019年12月公布。到那时我们才会清楚地了解现代人工智能否比乌鸦、狗或黑猩猩更聪明。这段等待的时间能发生什么还是令人无比期待的。

▲竞赛场地模拟图

这场虚拟奥运是AI的一次突破机遇

假设我们看到一条新闻，例如「某某AI智能体达到了老鼠的水平」，大多数人可能不为所动甚至嗤之以鼻：达到区区一个老鼠的智能水平算什么。要真算起来，离动物们我还差得很远。

最先进的AI可以超过人类成为最好的围棋选手，最好的医生，甚至智力竞赛冠军，但依旧无法与简单的动物竞争，以适应环境中的意外变化。通常AI基准测试涉及掌握单个任务，没有自由意志，也没有意识，它们仅仅是遵循智能人员定义的流程的产品，不能自己做决定。

▲网红机器人Sophia是否是人工智能炒作的产物

我们最好的机器学习算法通常只是记忆和运行统计模型，几乎任何自动执行某项操作的计算机程序都被称为AI。比如在围棋比赛中击败一个大师，机器被学习规则，从对手的视频里「偷师学艺」再「过河拆桥」。

比如深度学习和神经网络在内的机器学习中，人们通过算法以及标记包含大量训练的数据集，不断训练机器直到它可以自己完成任务。再如面部识别软件，从数千张面部照片或视频送入系统，直到它可以更准确的从未标记的样本中检测到面部。

但将以上相同的AI系统应用于完全不同的任务时，它们就会变成一个「废物」。这些缺陷对AI的研究人员来说并不是秘密，不过这些机器学习系统常常会被吹捧为人工智能最前沿的成果。事实上，他们并没有真的智能。

一只乌鸦会把岩石投入容器中，使水面上升解决口渴问题。狼群必须要在广阔的荒野中学会自食其力。动物们面对的大多数问题并没有明确定义的环境，也没有具体的数据库去跑程序，并有检查纠错总结经验。

这就是动物和AI较量的虚拟奥运会提出的AI要实战的两个问题：如何做到强化学习的泛化能力？当前的强化学习算法和动物学习之间有多大的差异？

这场竞赛的10级测试，均在不同的动物身上得到测试，AI智能体想要战胜动物，不仅要完成而且效率成果还更突出。对于泛化能力还未有突出效果的AI研究领域来说，想要赢得这场比赛真的不容易。

竞赛组织成员Matthew Crosby表示：「虽然我们都希望AI能在这场比赛中表现的优秀一点，但就算都失败这也不是一次性竞赛。我们希望用AI制造一个像动物的智能体，它总是想方法获得最多的食物，当不易获取食物时，它也应该热衷于探索环境，并在面对多种可能性的环境里做出明智的决定。」在到达人脑之前，AI不得不先经过动物世界的考验。