Google AI 七项原则发布一年,AI 业务掌门人杰夫·迪恩谈技术与善的距离
从 DeepFake 的 AI 换脸风波,到 DeepNude 的「一键脱衣」,越来越多人开始意识到人工智能技术被滥用后的阴暗面,察觉这些技术与恶的距离。
近日,Google AI 业务负责人杰夫·迪恩(Jeff Dean)在亚太地区的公开活动上,讲述了这些年来 Google 利用人工智能和机器学习技术做了哪些造福社会的事情,并且再次谈到他们对人工智能技术应用的原则和底线。
而这距离 2018 年 6 月,Google CEO 桑达尔 · 皮查伊(Sundar Pichai)宣布他们使用人工智能的七项原则以及四条底线,也过去一年了。
基于道德原则,超过 100 个项目被审查
杰夫 · 迪恩展示了一个印度学生团队使用开源机器学习框架 TensorFlow,所开发的空气质量监测 app。
这个 app 借助 TensorFlow Lite 以及机器学习模型,用户只需往空气中拍一张照片就可以得到当地的实时空气质量。
▲ Jeff Dean 放出了自己几十年前的怀旧毕业照
相比之下,迪恩表示 30 年前自己的毕业论文就是与神经网络训练有关,而直到如今,机器学习的相关技术才逐渐被广泛应用。他认为导致这个变化的重要原因是硬件的进步。
▲ Jeff 认为硬件的进步是人工智能技术被广泛使用的原因
目前 Google 在人工智能领域的大部分业务聚焦在机器学习上。通过输入像素、声音、文本等数据,计算机已经可以做到「看、听、说、理解」。
Google 在人工智能技术上的道德规范,主要体现在七项原则,以及四条底线上。
人工智能应该遵守的七项原则:
1. 对社会有益。
2. 避免制造或者加深不公平的偏见。
3. 在开发中进行测试以确保安全。
4. 对人类负责。
5. 隐私原则。
6. 坚守对卓越科学的追求。
7. 在使用中考虑首要用途、技术的独特性及适用性、使用的规模这三个因素。
四条底线是:
1. 对于那些将产生或者导致伤害的整体性技术,我们会确保其利大于弊,并将做好确保安全的相关限制。
2. 不会将 AI 用于制造武器及其它将会对人类产生伤害的产品。
3. 不会将 AI 用于收集或使用用户信息,以进行违反国际公认规范的监视。
4. 不会将 AI 用于违反国际法和人权的技术开发。
杰夫 · 迪恩(Jeff Dean)早期曾在大幅提高 Google 搜索的质量,后续是 Google 大脑业务的负责人,并在 2018 年开始掌舵 Google 的 AI 业务。除了有一大堆「Jeff Dean 有多神奇」的事迹,他也是这个地球上在人工智能领域最有影响力的人物之一。
作为 Google AI 业务的掌门人,杰夫 · 迪恩表示他们基于这套原则,已经审查了超过 100 个项目,并对数千名 Google 员工进行机器学习公平性方面的培训。
在用户隐私安全方面,迪恩则是提及了自家的「Federated Learning」,这项技术会将原始数据都保留在本地,并在本地建立一个数据库。Android 手机上 Gboard 键盘应用,就用到这个技术。
我们相信,人工智能可以帮助解决我们这个时代最困难的社会和环境问题——比如医疗、灾害预测、环境保护、农业或文化保护。
迪恩认为,让人工智能技术更加公平公正,不仅需要看到技术对现阶段的影响,还需要考虑到其对未来的影响。
而为了让技术可以更好地服务人类,Google 还开展了「AI for Social Good」项目,重点关注「科研与工程」(Research & Engineering)、「帮助他人解决重要问题」(Empower)。
Google 的 AI 能力,在解决哪些社会问题?
Google 的 AI 能力已经融入到搜索、邮件、输入法等产品的角落,同时也在医疗、农业、环保等不同的领域发挥作用。
这次 Google 展示了多个自家的项目,以及 4 个通过 TensorFlow 借助 Google AI 能力,在保护热带雨林、垃圾分类、检测农作物虫害、转录古代文献等方面做出贡献的外界项目。
▲ 洪水预测模型的示意图
准确率高达 75% 的洪水预测模型,是 Google 今年年初公布的新成果。这个模型建立在相当有限的数据量上,也使用了早期预测地震余震、卫星图像、量化火灾等研究基础。
有效的灾害预警可以大幅降低人员伤亡和财产损失的程度,这个洪水预警模型将会进入 Google 的公共警报程序,在搜索、地图、新闻等产品上对用户进行预警。
Google Health 的产品经理 Lily Peng 讲述了人工智能在肺癌筛查、转移性乳腺癌、糖尿病眼底检查这三个领域所取得的成就。
肺癌是最常见的癌症之一,占全球死亡率的 3%。Google 目前所建立的机器学习模型,通过分析 CT 扫描结果对病患的肺部恶性肿瘤进行预测。
结果显示,Google 现有模型所检测到的肺癌病例,比放射科医生增加了 5%,同时减少了 11% 以上的假阳性病例。
用于检测乳腺癌病人淋巴结切片的模型,已经能够发现 95% 的癌症病变,高于专业病理学家 73% 的检测率。
眼底病变检查也已经在印度等国家投入使用。
科技公司的新一轮技术竞赛,其中一个重点就是健康医疗领域,Google 则是将自己在 AI 技术上的优势与医学影像结合。
另外,Google 与美国国家海洋和大气管理局(NOAA)共同研究濒危物种座头鲸,对 19 年来所收集的声音数据进行处理和分析。目前已经可以做到从海洋噪音中识别座头鲸的叫声,制作鲸鱼活动的轨迹地图。
产品经理 Sagar Savla 讲述了 Live Transcribe 通过语音识别(Speech Recognition),为听障人士提供超过 70 种语言的实时自动转录对话功能。
Euphonia 项目也正在构建一个语音识别模型,帮助那些因残障、疾病而存在语言障碍的患者,让机器去理解他们说话的方式,在用语音帮这些患者「说话沟通」。
Google 曾通过「Impact Challenge」项目,向全球征集使用 AI 来帮助解决社会问题的方案。
其中印度尼西亚的 Gringgo Indonesia 基金开发了一个拍照就能识别可回收垃圾的应用,其中一个特点就是会在每个被识别的垃圾上,标出这个垃圾被回收后的价值。
除了印尼的朋友需要这个应用,国内尤其是上海以及后续 45 个垃圾分类的城市,也对这类应用有强烈的需求。
▲ Rainforest Connection
Rainforest Connection 项目也入选了 「Impact Challenge」的名单。创始人 Topher White 从 5 年前开始,将旧手机改造成热带雨林「千里耳」,通过监测森林中伐木车和电锯的声音,为护林员发出实时警报。近年来,他们已经开始使用 TensorFlow 对音频数据进行更深入的分析。
此次爱范儿对 Rainforest Connection 负责人 Topher White 进行了专访,他向我们透露了一个正与国内手机厂商进行的密切合作,相关报道将在后续发布。
此外,还有一个来自印度的研究所正在构建 AI 模型,用于自动检测和计算农作物上的病虫害数量。这个应用让印度棉花农民能够通过手机拍照,识别出相应的害虫,进而更好地种植农作物,控制农药的使用量。
日本学者 Tarin Clanuwat 博士训练了一个模型用以识别日本古籍中的草书,并将这些字符转录为现代日语。据悉这个模型能够检测约 2300 中字符,平均准确率为 85%。
上面这些无论是 Google 正在研发的项目,还是外界利用 Google AI 能力的项目,都离不开 TensorFlow。
作为全球影响力最大的机器学习开源平台之一,TensorFlow 目前已经拥有超过 4100 万的下载量。
在 2018 年 9 月时,TensorFlow 已有超过 200 万次来自中国的下载,其中包括知乎、英语流利说、网易、新浪、京东、咸鱼等在内的公司和产品也在使用 TensorFlow。