现在的 AI 就像娃:玩得转游戏却搞不定数学
随着 AI 技术的发展,几乎每次有新的成果,都会有人担心,我们离被机器统治的距离还有多远。不过,最近几条关于 AI 的消息可以让我们松一口气:至少它们现在还和普通孩子没什么区别。
“我不是在玩游戏,我是在学习!”
这是很多孩子被抓到偷玩电脑时经常说的一句话。不过在 AI 领域,这还真就是这样。因为,相比棋类运动这类单纯依靠策略的训练,游戏往往能够更好地模拟出现实世界的混乱。
在 2015 年, Google 旗下人工智能创业公司 DeepMind 就通过自我学习打通了包括弹砖块在内的 49 款雅达利经典游戏。但这其中,并不包括经典的吃豆人。
吃豆人这款看似简单的游戏,其实其背后蕴含的策略,要比围棋复杂得多。要玩好这个游戏,对 AI 来说,它需要完成四件事情:走迷宫、吃小球、吃水果和躲避敌人。而真正的难点,在于如何让 AI 在不到 1 秒的时间内基于这四种情况做出最佳选择。简单的说,就像是让四个分属不同部门的人在 1 秒内完成对当前状况的评估并就如何行动达成一致,还不能出错。
此前,这款游戏已知的最高分由人类威尔逊(Wilson Oyama)保持,为 266,330 分。但在几天前,这一纪录被加拿大的一家创业公司打破。他们训练的 AI 成功拿到了之前被认为只能通过作弊来获得的理论上最高成绩—— 999,990 分。
( 26 万分需要打到第 35 关。图源:High Score )
无论是围棋也好、吃豆人也罢,随着时间的推移, AI 在游戏方面的能力已经越来越强。可在其他领域呢?
看不懂话、写不明白题,AI 参加高考显不足
当让 AI 和人类一样做数学题的时候,AI 就显得力不从心了。当然,这里的技术难点其实并不在于如何做题,而在于与出题人、阅卷人沟通上。
据正在领导开发高考机器人 Aidam 的陈瑞峰所说,让 AI 参与高考,有三大难关。
首要难关是需要让 AI 理解题目的意图,并将其转换为准确的、可被机器理解的语言;其次,是逻辑推理,通过已有的题库来推测最佳的解题路径并得出结论;最后,则是输出关。机器需要再度把之前思考的过程转换为人类能够理解的语言,输出到试卷上。
(想让机器理解这个笑话,估计还有点难度。图源:Disp)
简而言之,想要答好题, AI 不仅要读懂、解答题目,还需要让人用看得明白的方法答题。这些难关听起来简单,但要让 AI 真正准确做到,确实难偿所愿。
据报道,在今年 6 月 7 日, Aidam 再度挑战高考。这次,它回答了全国卷二文科数学卷,获得了 134/150 分的高分,却依旧不敌同场竞技的高考状元们。
这已经不是 AI 在标准化测试考试中的第一次尝试。
早在 2015 年,华盛顿大学也研发了一个 AI ,专注于 SAT 数学几何部分的解答,其正确率也只有可怜的 49%。
而在 2016 年,日本的东 Robo 机器人在屡屡冲刺东大失败后,也放弃尝试,转而投身数据分析事业。
总而言之,尽管科技界一再警示我们 AI 发展将给我们社会带来的冲击,但就目前而言,它依旧处于早期发展阶段。在 AI 发展出与人类顺畅交流的能力之前,我们暂时还不用担心它对人类社会带来的伤害。
图源: Disruptor Dail