人工智能是如何在 Google 崛起的?

公司

2016-06-28 10:20

前不久,Google 的 CEO 桑达尔·皮查伊在接受 Forbes 专访时,非常明确地指出了:Google 将在一切服务和设备中,或早或晚地采用人工智能技术。

BackChannel 的一篇来自 Steven Levy 的文章描述了 Google 从培训、雇佣、管理、技术等各个方面的措施和转变,并且介绍了机器学习在 Google 崛起的历史、克服的阻力、以及势不可挡的未来。

Google 正在打造机器学习的 “忍者团队”

1-bCmhbOiwzJLGzbpFFz2n8A@2x

Carson Colgate,一名 Google 机器学习队伍的新成员。图片来源:BackChannel

Carson Holgate 正在训练自己成为一名 “忍者”。

她今年 26 岁,之前已经在跆拳道里拿过一个二级的黑带。 这次,她要做的是在算法上成为一名 “忍者”。 她在 Google 的 Android 部门担任工程师,现在则被收录到 Google 内部的一个机器学习 “忍者项目”。这个项目只招收了 18 个人,这 18 个人却都是 Google 各个产品部门的精英。他们将要把学习到的人工智能技巧,用于打造他们各自负责的产品。

在 Google 负责内部机器学习、管理此 “忍者项目” 的产品经理 Christine Robson 说:“这个项目邀请 Google 全公司对机器学习感兴趣的工程师, 与机器学习团队一起学习 6 个月,跟导师取取经,做一些项目,然后开展和实施项目,从中学习经验和教训。”

很多年来,机器学习被认为是一个只有技术精英才懂的技术专项。 但是现在,机器学习成为了将人类智慧与电脑智慧结合在一起的不二途径。 Google 致力于在公司内部制作多一点机器学习的 “精英”,甚至想要让机器学习成为工程师的常规技巧。

Google 是一个庞大的公司,六万个雇员里面,有将近一半都是工程师。对比之下,这个目前只有 18 个人的机器学习忍者项目,实在很小。但是这个项目表明了 Google 一个认知上的转变——机器学习已经成为最受重视的新方向之一。

虽然 Google 一直都有采用机器学习的技术,也一直致力于雇佣这个领域的人才,但是直到 2016 年, Google 才开始执迷于机器学习这项科技。 去年年末, Google 的总裁 Sundar Pichai 就说出了 Google 的新态度:

“机器学习是一个核心的、转变式的改变,它将改变我们做每一件事的方式和想法。 我们有目的地在我们的各项产品中运用机器学习,无论是搜索,广告,YouTube,还是 Play。我们目前所处的阶段还早,但是你会看到我们一个系统性、规模性的进展——我们将在众多的领域使用机器学习。”

因而这个逻辑很清晰:如果 Google 真的想要在全线的产品中运用机器学习,它的工程师也必须掌握机器学习的技巧, 这个技巧将和传统的编程很不同。正如知名的机器学习宣言《高超算法》一书的作者 Pedro Domingos 所言:

“机器学习确实是太阳底下的新鲜事:它将自己建造(和实现)自己。”

机器学习是如何在 Google 崛起的?

1-5lUAN_vLqofTETWusmVhTg@2x

Jeff Dean,Google 的神级人物,正在带领 Google 转向机器学习的时代。图片来源:BackChannel

做好机器学习,意味着辨识正确的数据,选择正确的算法,并且确保所有的其他条件都正确,才能成功。

Jeff Dean,Google 软件部的神级人物,如今带领着机器学习团队,建造各种工具,帮助 Google 工程师加深机器学习的技能。根据他的预测:今天 Google 25000 个工程师中,只有几千个工程师精通于机器学习。 而 Jeff Dean 的愿景是:所有的 Google 工程师都要懂得机器学习的一些知识。“我们将要尝试实现这个目标。”

John Giannandrea 一直以来都在 Google 内部提倡机器学习的重要性,而时代造英雄,在 Google 的机器学习时代,Giannandrea 成为了搜索业务的负责人。但是当他 2010 年刚到公司的时候,他并没与多少机器学习的经验。 2011 年的时候,他在一个会议上得知 “神经信息处理系统”(Neural Information Processing Systems,NIPS), 从此欲罢不能。

从此,每一年,NIPS 都使用机器学习创造着科技界的神话,解决着如翻译、声音辨识、或者视觉辨识等诸多领域的难题。Giannandrea 回忆道当时参加这个 NIPS 会议的时候,这个会议非常不知名,“但是这个领域在学术和科技界都在过去三年高速成长。去年参会者达到了 6000 人。”

不只是 Giannandrea 认为机器学习将会成为科技的核心。 Google 内部的机器学习拥护者越来越多。 比如,Google Brain 的联合创始人 Dean,他曾在 Google X 负责一个神经网络的研究计划。这些在 Google 进行的机器学习运动,说明了 Google 对计算机的决心和信心。

如今在机器学习领域最领先的为 “深度学习” 算法,这个算法的模型由人脑启发,建立在复杂的神经网络之上。Google Brain 以及 Google 在 2014 年 1 月以 5 亿美元收购的 DeepMind,都在深度学习这一块集中力量开发。 DeepMind 开发了 AphaGo,并在围棋比赛中将人类的冠军打败了,这件事激发了人类对人工智能深深的恐惧。 Giannandrea 觉得人工智能绝对不会把人类赶尽杀绝或者取代人类,但是,它将要深刻地变革我们生活的每一个方面。

机器学习的概念在 Google 绝不是新鲜事。 Google 的创始人一直以来相信人工智能的力量。十年前,Google 已经开始在公司内部给工程师教授机器学习的课程。 2005 年的时候, 研究科学家 Peter Norvig 开始在每周三在 43 号楼给感兴趣的 Google 工程师讲授机器学习。课程如此受欢迎,以至于在 Bangladesh 的工程师熬夜到凌晨,只为了远程打个电话过来一起听课。而 2013 年,整个 Google 都意识到了机器学习的重要性。

随着机器学习的重要性在 Google 内部崛起,Jeff Dean 也开始认真思考:

“在过往,我们可能会使用机器学习,去改善系统的某几个方面。但现在我们真的是要用机器学习去取代整个旧的系统。”

机器学习正在让产品有着以往不可想象的新功能。比如去年 11 月发布的 Gmail 上的智能回复功能,就是缘起于 Google Brain 与 Gmail 团队的一次对话。 Google 一直鼓励着这种合作,让这两个团队保持密切的联系。

传统的对人工智能语言的理解是:人们需要将语言的规则嵌入到系统,但是在 Gmail 的智能回复中,这个系统拥有足够多的数据,它自己就可以学习和完善自己。

不过当这个团队在开始测试智能回复的时候,这个软件有一个很诡异的问题:它总是在建议一些不太符合场合的浪漫性的回复。 当它感到困惑的时候,它就会开始说:我爱你。这不是什么软件上的故障。这个错误可能就是它从人类行为中学习而来的: 如果你处于不知所措或者困窘的状态,说 “我爱你” 是个很好的防范策略。

克服重重阻力,机器学习渗透到了搜索算法中

1-jYxiNXAu3k_ezEnJslWloQ@2x

Greg Corrado 为 Google Brain 的联合创始人,正在和其他产品团队合作,将机器学习带进 Google 的每个产品。图片来自:BackChannel

自从去年 11 月发布智能回复之后,Gmail Inbox 应用的用户就可以选择三个自动生成的回复,而且这些自动生成的回复准确性一般很高。 现在,从手机移动端的 Gmail 用户发出的回复中,十分之一都是由机器学习系统创造的。 Gmail 的成功只是 Google 成功运用机器学习的一个极小的例子。

但是当机器学习被运用到搜索功能,这就是极大的转折点了。一直以来,搜索都有运用到机器学习,但是很多年以来,这个公司最重要的搜索算法,都被认为太过于神圣,而不能被机器学习算法所玷污。机器学习对于搜索的作用,一直都受到怀疑。

这种怀疑,部分源自于一种文化上的抵抗:一直以来,高超的黑客们都想要对程序有完全的掌控,而机器学习难免有点太禅意般的 “放任自流”。 Amit Singhal 是一个经验丰富的搜索工程师,是传奇式的电脑科学家 Gerald Salton 的学徒,Singhal 当年修改了 Google 创始人布林和佩奇的编程作业,让他们的程序变为可以量化扩大的工具。 Singhai 对于把机器学习并入搜索算法,曾经抱着怀疑的态度。 Google 的工程师 David Pablo Cohn 证实当时他们用机器学习提高搜索的沮丧的尝试:

“Amit Singhai 的算法当时是世界上最棒的,我们只能通过复制他的想法来做好。当时我们找不到任何比他的方法要好的东西。”

到 2014 年早期的时候,Google 的机器学习专家们继续挑战这种局面。结果,机器学习团队的实验成为了搜索的一个核心部分:通过看用户是否点击了搜索词条,来判断搜索呈现的结果是否更好地匹配搜索的词条。

如今,机器学习所建立的搜索匹配的成果 RankBrain,已经是搜索算法的一部分。RankBrain 于 2015 年 4 月的时候上线。 Google 一直以来对于搜索功能如何运作都是闪乎其辞,但是 Jeff Dean 很明确地说:

“RankBrain 这个机器学习的产物在每一次检索中都发挥作用,并且在大部分的检索中影响着排名。”

并且,这个机器学习的算法证明是非常有效的。 每一次的 Google 搜索都要用上几百个信息点(比如,用户所处的地理位置,以及页面的标题是否与搜索词条匹配),而 RankBrain 提供的信息点,是所有信息点中的重要性排在了第三。

打败了传统编程后,机器学习该如何在 Google 普及

1-FQ7aoOSVSIit8GeoydsC4A

Christine Robson 是 Google 内外机器学习活动的组织者和带动者。图片来自:BackChannel

机器学习在搜索中获得成功,对于 Google 而言非常重要,这让很多人开始真的注意起机器学习来。 而华盛顿大学的教授 Pedro Domingos 用更直白的语言说:

“一直以来,在传统编程者与机器学习者之间都存在着一场战争。结果机器学习者在战斗中获胜了。”

Google 目前的挑战是要将他们的工程师队伍过渡到机器学习的队伍,不要求每个人都熟悉掌握机器学习,但起码需要熟悉机器学习。 不仅 Google 在这么做,很多其他的公司(比如 Facebook)都在积极迈进机器学习的时代。Google 正在各个名校的机器学习领域抢夺人才。 Google 也即将在苏黎世开设一个机器学习研究中心,抢夺机器学习人才的战争,延伸到了欧洲。

基于目前学术界并没有造出很多的机器学习人才,保持这方面的人才就显得至关重要。在 Google,这并不是易事。因为大部分的顶级工程师一辈子都通过传统的编程取得成就。但是机器学习所要求的,是全新的思维。编程者一般通过对编程的控制来进行创造,但是机器学习要求掌控的是某些具体类型的数学和统计学,但是这些领域的知识,甚至对于一些顶级的、可以解决复杂问题的工程师而言,都是陌生的,他们之前也根本不愿意学。

Christine Robson 正在致力于给 Google 的工作人员创造更好的机器学习的环境:

“机器学习与静止不变的编程不同:你要经常给它提供新数据,我们要一直更新模型,一直学习,要一直添加更多的数据,一直转变我们预测的方式。机器学习就像是一个活生生的、会呼吸的家伙,它和传统的计算机编程完全不同。”

但是,Google 对训练工程师学会机器学习的前景是乐观的:如今在机器学习中使用的数学不算太复杂,大部分 Google 的工程师都可以学会。Google 并且建造了类似 TensorFlow 的工具,帮助工程师学习机器学习。TensorFlow 也为 Google 在雇用人才方面增加了吸引力。当 Google 开设 TensorFlow 公开课时,有 75000 人报名参加。

目前 Google 最大的任务,就打造更多可以完善这些机器学习工具的人才。他们也在内部建立了大量的机器学习的课程,“下一次的课程,已经有好几千的工程师报名参加。”Jeff Dean 说。

毫无疑问,机器学习,将会是 Google 一个重大的发展方向。 我们的未来,将会是一个机器学习和人工智能的未来。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中