玩游戏打不过电脑?因为对手可能是 Google AI
一场著名的棋局让 Google 旗下 DeepMind 开发的 AI 成为了人尽皆知的明星“棋手”,可是你知道吗?这款 AI 不仅仅会下棋,还会和人一样玩游戏。
DeepMind 在 Youtube 频道中发布了一段 39 秒的视频,展示了 AI 借助深度强化学习异步算法的帮助,玩 FPS 射击游戏《毁灭战士》。
(优酷视频)
《毁灭战士》是一款 3D 游戏,DeepMind AI 的目标是在其中一个迷宫关卡中尽可能快速地收集所有的苹果,并在一分钟之内找到出口,刷新最高分记录。
人类想要通过这样的关卡并不太难,因为人脑本身就是一个非常成熟的思维系统,也是每个人类与生俱来的特性。但是 DeepMind AI 想要通关却并非易事,因为这款 AI 的最大特色在于它无需对游戏源代码有任何的接触,学习玩游戏的方法和普通人类几乎一模一样。
根据 New Scientist 报道,DeepMind 基于深度强化学习技术开发了这款人工智能程序,通过融合的深度神经网络(deep neural network)和经验回放技术(experience replay),AI 可以分析、学习并记忆游戏画面中出现的场景。不过想要在迷宫中快速找到出口,这样的技术够用吗?
当然不够,想想我们自己是怎样走出一个迷宫的?
在这段 39 秒的视频中我们能够明显地感受到 AI 的熟练度正在逐渐提高。DeepMind 植入的另一种关键技术是异步强化学习(asynchronous reinforcement learning),有了这种技术,AI 可以用不同的方法解决同一问题,并对比这些经验,从中寻找最优的问题解决方法。
在 2015 年,DeepMind 团队训练这款人工智能“游戏玩家”玩过 Atari 2600 游戏机上的 49 款游戏,不过在挑战新游戏的分数记录之前,科学家需要连续 8 天用高端的 GPU 对 AI 进行训练。后来升级过的 AI 只需要在性能有限的 CPU 上训练 4 天就足够了。
《毁灭战士》的迷宫对于 DeepMind 最新的“游戏迷”来说成为了一个可以触及的目标,即使这款游戏仍然是它遇见的最有挑战性的对手。
在上手《毁灭战士》之前,DeepMind 还让 AI 玩了另一款《The Open Racing Car Simulator》开源 3D 赛车游戏,它一举超越了 90% 的人类成绩。
(优酷视频)
其实这样的现象想想还是挺有趣的,说不定哪天我们在玩 GTA Online 的时候就会碰上一堆 DeepMind 的小号来刷经验了。
题图来自:卫报