动物 v.s. AI 奥运会:你会赌一只鸟还是机器人夺冠?
本文来自公众号 PingWest 品玩(ID:wepingwest),作者 Cactus,爱范儿经授权发布。
AI 能解决以前从未见过的任务吗?这场比赛正在测验这种事。
我们不得不面对AI的一个事实:如今的人工智能,其实智能的成分很少。在事先明确环境和问题的前提下,基于算法和大数据的深度学习,人工智能系统的确都能有不错的表现。
这就是为什么谷歌 AlphaGo 以 4:1 战胜围棋世界冠军、职业九段棋手李世石;汉森机器人索菲亚能对着你口吐莲花,以「就像活人的 AI」招牌狂言想要毁灭人类。
AI 研究的真实状态其实远远落后于我们所相信的技术神话。虽然大多数研究成果是真实的,但有很多是借助人工智能话题的炒作。
我们对于AI的最终梦想,是让机器拥有自主思考能力并非「培训考核」。
检查机器是否真的拥有智能,让机器通过图灵测试就可以,但直到今天图灵测试依然没有被突破,这或许是件好事也是件坏事。如果我们不以更健康的现实主义和怀疑态度对待人工智能,那么这个领域或许永远停留在车辙中。
近期刚拉开序幕的,由英国帝国理工学院和剑桥大学共同组织的「动物 vs AI奥运会」是一项有趣的竞赛实验。更有嚼头的是,就像组织者成员之一Matthew Crosby所说的那样,这场竞赛对于参与者和创办者都是不可控且极具颠覆的。
真正的竞赛,最终赛场布置只能「当天见」
较新的AI「培训课程」正在使用随机生成的环境进行测试和开发,正如这场「动物 vs AI 奥运会」。
竞赛组织已经公布大约50项关于动物的智能文献研究,参赛队伍即可根据公开的大量培训环境和对象进行AI动物智能体的「大脑」构建。
这是一个泛化的挑战,所以在训练测试中他们必须以不同的方式使用对象,同时也要使对象学会适应环境。挑战者们需要自己进行场景设置和互动,最终提交一个像动物一样进行食物猎取活动的智能体。
「这场比赛的重点是AI没见过的任务,所以最终比赛现场什么样,只有当天才知晓。」赛事组织者之一Matthew Crosby说。虽然不能对最终比赛进行「泄题」,但是在50项关于动物的智能文献研究中潜藏着一些有趣的例子供参赛者构建AI智能体的大脑。
▲模拟动物获得的智能体示例图
例如一个经典的实验,在动物面前倒置一些不透明的杯子,在其中一个杯子下放了一些食物,动物的任务是取回食物。起初每次都把食物放在A杯(相当于训练阶段),然而在最终比赛现场,这个食物会被放在B杯下。对于有些动物,比如黑猩猩,他们会直接选择B杯,但有些动物会选择A杯,因为他们通过记忆学习完成这项任务。
再例如一个从伊索寓言中汲取灵感得到的实验:一只乌鸦能学会叼起岩石投入水中,使水位上升到足够。但在实验中,可以设置既有岩石也有软木块的环境,乌鸦要学会选择岩石而不是软木塞投入水中。
「这些测试捕获了人工智能研究中很多被认为相当困难的元素,比如推广知识、转移学习、综合新信息、甚至可能创造性解决问题。参赛者们要面对大量不同环境的训练集,以应对最终未知的竞赛场景。」Matthew Crosby解释道。
▲乌鸦在面对水和沙子时能做出正确选择
「10项关卡」见分晓,AI想赢不容易
比赛共分为十个等级,测试是否成功取决目标实现程度。对大多数动物来说,能解决的是基础范围,只有少部分动物能解决的是困难且等级高的实验。
「觅食测试」是入门测试。可以考验AI智能体获取食物的能力,短时间能获取食物越多则越强。
「偏好测试」,则进一步考核智能体的则优能力。尽管对于不同动物来说会存在方式差异,但几乎所有动物都会用最简单高效的方法获得食物,其中有些动物对最有益的长期行为作出复杂的决定。
「障碍测试」、「弊害测试」、「空间推理测试」、」内部模型测试「,将从智能体的行动、规避风险、导航规划、视觉输入记忆上考研智能体的多项能力。
▲AI智能体也要面对和狗一样类似的障碍测试
「泛化测试」,这一级包括一些看起来与之前测试有所不同的环境,但解决方式还是一样的,不挑剔的智能体才有希望通关。
「物体存继性测试」,当一个物体从视野中消失,很多动物都能理解它依然存在的,这是人类认知范围能理解但AI不能的,如果不能理解这一特性,很多简单的人机交互就很难实现,开发者如何将这一点编制进AI将是竞赛一大亮点。
「高级偏好设置」,意味着智能体通过更复杂的决定获取更高级别的奖赏。
「因果推理测试」作为最终测试,希望看到智能体提前策划并在未实施之前就能预想到结果的能力。这种测试已经在一些动物身上得到验证。
如今这场虚拟奥运会比赛上线,奖金达到3.2万美金,比赛最终结果会在2019年12月公布。到那时我们才会清楚地了解现代人工智能否比乌鸦、狗或黑猩猩更聪明。这段等待的时间能发生什么还是令人无比期待的。
▲竞赛场地模拟图
这场虚拟奥运是AI的一次突破机遇
假设我们看到一条新闻,例如「某某AI智能体达到了老鼠的水平」,大多数人可能不为所动甚至嗤之以鼻:达到区区一个老鼠的智能水平算什么。要真算起来,离动物们我还差得很远。
最先进的AI可以超过人类成为最好的围棋选手,最好的医生,甚至智力竞赛冠军,但依旧无法与简单的动物竞争,以适应环境中的意外变化。通常AI基准测试涉及掌握单个任务,没有自由意志,也没有意识,它们仅仅是遵循智能人员定义的流程的产品,不能自己做决定。
▲网红机器人Sophia是否是人工智能炒作的产物
我们最好的机器学习算法通常只是记忆和运行统计模型,几乎任何自动执行某项操作的计算机程序都被称为AI。比如在围棋比赛中击败一个大师,机器被学习规则,从对手的视频里「偷师学艺」再「过河拆桥」。
比如深度学习和神经网络在内的机器学习中,人们通过算法以及标记包含大量训练的数据集,不断训练机器直到它可以自己完成任务。再如面部识别软件,从数千张面部照片或视频送入系统,直到它可以更准确的从未标记的样本中检测到面部。
但将以上相同的AI系统应用于完全不同的任务时,它们就会变成一个「废物」。这些缺陷对AI的研究人员来说并不是秘密,不过这些机器学习系统常常会被吹捧为人工智能最前沿的成果。事实上,他们并没有真的智能。
一只乌鸦会把岩石投入容器中,使水面上升解决口渴问题。狼群必须要在广阔的荒野中学会自食其力。动物们面对的大多数问题并没有明确定义的环境,也没有具体的数据库去跑程序,并有检查纠错总结经验。
这就是动物和AI较量的虚拟奥运会提出的AI要实战的两个问题:如何做到强化学习的泛化能力?当前的强化学习算法和动物学习之间有多大的差异?
这场竞赛的10级测试,均在不同的动物身上得到测试,AI智能体想要战胜动物,不仅要完成而且效率成果还更突出。对于泛化能力还未有突出效果的AI研究领域来说,想要赢得这场比赛真的不容易。
竞赛组织成员Matthew Crosby表示:「虽然我们都希望AI能在这场比赛中表现的优秀一点,但就算都失败这也不是一次性竞赛。我们希望用AI制造一个像动物的智能体,它总是想方法获得最多的食物,当不易获取食物时,它也应该热衷于探索环境,并在面对多种可能性的环境里做出明智的决定。」在到达人脑之前,AI不得不先经过动物世界的考验。