• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

AlphaGo 是如何一步步接近成为围棋 “上帝” 的?

公司

2017-05-24 18:25

正如赛前很多人预料的那样,在与 AlphaGo 的第一场围棋对战中,柯洁输了。

不过,也正如爱范儿(微信 ID:ifanr)在昨天比赛结束之后一分钟内发布的总结文章所言,AlphaGo 已经今非昔比。确切地说,无论是 DeepMind 对它的命名,还是它背后的计算力量,乃至它自身的棋力,都发生了脱胎换骨的变化。

5 月 24 日,赶在第一局比赛结束之后,DeepMind CEO Demis Hassabis 在第二天举行的中国乌镇人工智能高峰论坛中,专门谈到了 AlphaGo 背后的研发过程和对战故事,以及对这次比赛中 AlphaGo 的相关问题进行了解读。

Hassabis 首先对 DeepMind 进行了简单介绍,然后开始谈起 AlphaGo 背后的复杂性。他表示,计算机下围棋之所以异常困难,是因为围棋的复杂程度让穷举搜索都难以解决;由此衍生出两项难题:一是不可能写出评估程序以决定谁赢,二是搜索空间太过庞大。

而在具体的 AlphaGo 研发过程中,DeepMind 更是要考虑直觉和计算的问题;因为围棋是一种独特的游戏,它具有以下特征:

  • 围棋不像象棋等游戏靠计算,而是靠直觉。
  • 围棋中没有等级概念,所有棋子都一样。
  • 围棋是筑防游戏,因此需要盘算未来。
  • 小小一子可撼全局。
  • “妙手” 如受天启,玄妙深奥。

2016 年 3 月,AlphaGo 与韩国围棋选手李世乭九段进行了举世瞩目的 “人机大战”,最终以 4:1 的比分获胜;其中,AlphaGo 在第二局中下出了令人惊叹的第 37 步棋,不过在第四局中也被李世乭的 “神之一手” 所困扰。

Hassabis 介绍说,AlphaGo 与李世乭之间的对决,对围棋本身的影响是多个层面的。首先是体现的围棋的影响力上,这次对决拥有 2.8 亿观众和 3.5 万篇报道,并且推动围棋棋盘的销售量增加了 10 倍,让不少西方人开始关注这项来自东方的古老技艺。

但 AlphaGo 给围棋带来的真正改变在于思维方式的启发;李世乭在赛后表示:

我认为这给围棋引入了新思路,我感觉找到了自己下棋的理由。

对于 DeepMind 团队来说,AlphaGo 与李世乭的对战也让他们对 AlphaGo 有了新的判断。Hassabis 表示,AlphaGo 在与李世乭的对决中,不仅仅表现出了它应有的认知能力,甚至已经表现出了一定的创造力,虽然是非常有限的。

在 2017 年元旦前后,AlphaGo 以 Master 的身份与包括柯洁在内的 60 名人类顶尖高手进行了对战,并全部获胜。Hassabis 表示,在这 60 场对决中,AlphaGo 表现出了更强的创造力,尤其是在它与辜梓豪和朴廷桓的对决中。

赛后,柯洁表示:

人类数千年的实战演练进化,计算机却告诉我们人类全部都是错的,我觉得,甚至没有一个人沾到围棋真理的边……我们棋手将会结合计算机,迈进全新的领域达到全新的境界……人和 AI 应该可以趋近围棋真理。

在 Hassabis 的演讲之后,AlphaGo 团队负责人 Dave Silver 上台揭露了 AlphaGo 的更多细节。

Silver 表示,其实与李世乭对战的版本的全名为 AlphaGo Lee,它在 Google Cloud 上使用了 50 个 TPU(全称为 TensorFlow Processing Unit,是 Google 为了加速深层神经网络运算能力而研发的芯片);而 Master 的全名为 AlphaGo Master,它实际上是运行在单个 TPU 机器上,它的强大之处在于能够从自我对弈中强化学习,同时也使用了更强大的策略&价值网络。

实际上,在 AlphaGo 团队的评估中,AlphaGo Lee 的等级分为已经在 3500 分和 4000 分中间,而 AlphaGo Master 的等级分已经超过 4500。作为对比,当今世界排名第一的柯洁在 GoRatings 的等级分为 3620。

(AlphaGo 各个版本的评估分)

(AlphaGo 已经被踢出评估体系)

至于这次与柯洁对战的 AlphaGo 版本,Silver 表示此次 AlphaGo 使用了第一代的 TPU,并不是 Google 前不久公布的第二代;另外,今年升级版的 AlphaGo 是在单机上运行的,它的物理服务器上部署了 4 个 TPU。

由此可以想见的是,这一次柯洁将要面临的是多么可怕的对手。

值得一提的是,在 5 月 23 日的赛后发布会中,柯洁表示:

如果把 AlphaGo 当人的话,跟去年相比,它已经完全是两个人;去年的时候,AlphaGo 所下的棋还是很接近人的,现在已经接近围棋上帝了。

跟上帝交手是一种怎样的体验?柯洁九段也许是这个世界上唯一有资格回答这个问题的人。实际上,我们已经不太相信他会在接下来的两局比赛中能够赢上一局了,但是我们希望被打脸。

祝福柯洁。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中