视频游戏和棋牌比赛并不能很好地衡量 AI 的智力

AI 已经横扫了棋牌比赛，他们用人无法想象的招数打败成名已久的棋手，重挫锋芒毕露的天才。

就连唯一打败过 AlphaGo 的李世石在退役时也感叹一切已不复当年。「随着 AI 在围棋游戏中的亮相，我已经意识到，即使我通过疯狂的努力成为了第一名，我也并没有位居榜首。」

AI 从某种程度上摧毁了这些成名选手的信心，但这并不能代表它们已经足够聪明。

在 Google 软件工程师 Francois Chollet 看来，AI 赢了比赛的成就并不是一个衡量智力的好标准。就像是你 5 岁的小侄女特别擅长拼乐高，她在乐高的拼接速度上甚至超过了你，但这并不能证明你侄女在其他领域都比你聪明。

在最近发表的论文《论智力的衡量》中，Chollet 提出的新观点是人工智能世界需要重新关注什么是智力，什么不是。Chollet 认为研究人员若想在通用人工智能方面取得进展，他们需要超越视频游戏和棋牌比赛等现在流行的判断标准，去思考那些实际上让人类变得聪明的技能，比如概括和适应能力。

在人工智能领域，有两个不同的智能概念。其中一种智能是指能胜任多任务的能力，而另一种则优先考虑适应性和泛化能力，即人工智能应对新挑战的表现能力。

在最早的 30 年，前者明显更具影响力，即智力是一套静态程序和一个明确的知识库。而人工智能社区中关于概念化智能的讨论则只获得了极少的关注度。

Chollet 认为现在的研究人员应该认识到这一点，所有人只针对一个方向的研究并不是一件好事。在一个尚充满未知的领域，这种态势限制了研究人员发挥的空间。

AI 需要一个更好的智能定义，而非一个静态测试。

在静态测试中，一旦你选择了一个衡量标准，你就会采取任何可能的捷径来「玩弄」它。例如，如果你把下国际象棋作为衡量智力的标准(我们从上世纪 70 年代开始，一直到 90 年代都以此为标准)，你最终会得到一个下国际象棋的系统，仅此而已。

没理由认为它对其他任何事都有好处，这并不能教会你关于人类智能的任何东西。如今在 Dota 或星际争霸等电子游戏中的人工智能也陷入了同样的智力陷阱。

▲ DeepMind 的研究人员观察他们的 AI 在《星际争霸 II》中如何对付人类玩家。

对于我们人而言，一个人技能的精通程度和智力是息息相关的。顶尖的程序员绝不是只会码代码，优秀的作家在艺术其他领域也颇有造诣，我们也会认为擅长围棋的人就是聪明的人。

人类的大脑可以因其智力而在某个特定任务的技能上表现出色，但这不是一种单一的技能。比如从小开始学习围棋的孩子，他们不是只会下棋，他们同时也在学习数学、语言等基础知识，围棋之外可能还有编程、绘画等爱好。这些孩子从零开始学习下棋，但他们不是专门「用来」下棋的，他们可以把这种学习能力引导到许多其他的任务中，学习其他内容，这就是通用性。

人工智能的存在打我了我们原有的概念——擅长下棋的就是聪明的。人类在学习上的情况不适用于机器，人工智能不是拟人化的。我们通用的智力可以用于特定的任务，但擅长特定任务的人不一定拥有通用的智力。一切是不可逆的。