Google 宣布开源 AI 训练环境 DeepMind Lab

新创

2016-12-10 00:01

根据 Engadget 的报道,AlphaGo 背后的 Google 人工智能团队 DeepMind  宣布开源其 AI 训练环境 DeepMind Lab,源代码将上传到 Github 上。Google 希望以此增加 AI 能力的开放性,让更多开发者参与 AI 研究。

alphaogoopensource

(图片来自 DeepMind 官网

实际上,DeepMind 在人工智能领域名声相当大,其研发的 AlphaGo 如今的水平已经几乎打遍天下无敌手了。

昨天,2016 年三星杯世界围棋大赛决赛中,中国棋手柯洁总比分 2:1 逆转卫冕。赛后,据新华社采访,柯洁坦言自己“现在的状态还不能打败‘AlphaGo’,今后需要更加努力。”

alphagooopensource3

AlphaGo 的战绩确实足够耀眼,让这位史上最年轻的三星杯冠军不想直缨其锋芒:

  • 2015 年 10 月,它成为第一个无需让子,即可在 19 路棋盘上击败围棋职业棋士的电脑围棋程序;
  • 2016 年 3 月,它以 4:1 的比分击败顶尖职业棋手李世乭,成为第一个不借助让子即可击败围棋职业九段棋士的电脑围棋程序;
  • 2016 年 7 月 18 日,根据积分,Go Ratings 网站将 AlphaGo 列为世界围棋排名第一,至此,人工狭窄智能又攻下了一片领地。

近 20 年的发展,围棋人工智能从传统人工智能方法,如使用暴力搜索法(穷举法)、Alpha-beta 剪枝(评估后一个策略是否比前一个策略差,差则停止计算该策略后续发展)等,进化到使用蒙地卡罗树状搜索。蒙地卡罗树状搜索分为三部分:

  1. 走棋网络:给定当前局面,预测/采样下一步的走棋
  2. 快速走子:适当牺牲走棋质量的条件下,速度提升 1000 倍
  3. 估值网络:给定当前局面,估计是白胜还是黑胜

这样,既可以结合树状图的长远推断,又可以像人类大脑自发学习进行训练。

alphagoopensource6

通过学习超过 1 亿盘机器棋局和 80 万人类棋局,单机版 AlphaGo 已经能将已有的围棋人工智能甩在身后,而分布式版本的 AlphaGo 则更是在对战其他围棋人工智能的 500 场比赛中获得全胜。

Elon Musk 的 OpenAI 旗下电脑训练场 “Universe” 也开放成为开源资源。

alphagoopensource7

当然,虽然谈及开源,两家公司都表示希望一直保持 AI 代码的开放性,但实际上,这也是一个略带无奈的举措。正如 Engadget 对此的评价,两家公司发展至今,最稀缺的加速推进人工智能开发的东西就是海量数据,这也是为什么两个公司会选择开源了这部分的代码。

后评论

评论在审核通过后将对所有人可见

正在加载中