• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

Ground Truth:Google 是如何构建地图的?

公司

2012-09-08 08:52

对于许多人来说,Google 地图已经成为日常生活的一部分,但是你知道 Google 地图是如何构建的吗?在我们能够看到的地图背后,其实还有一个更加复杂的地图,包括了现实世界中获取的庞大数据,而地图的构建中投入了大量的人力。最近,Google 向 Atlantic 网站的   Alex C. Madrigal 展示了深层的地图及其构建过程。这是公司第一次向外人展示 Ground Truth 计划。

一个搜索公司为何要去制造世界上最好的电子地图?在 Google 看来,地图同样与 Google 的使命密切相关。Manik Gupta 是 Google 地图高级产品经理,他告诉 Atlantic,“如果你观察下线下世界,会发现在我们真实生活的世界里,信息并不全是在线的。随着我们生活需求的增加,我们试图填补所看到的真实世界和在线世界的鸿沟,地图就是起这个作用的”。

Google 开发地图的办公室并不起眼,只是山景城郊区一栋低层建筑。在那里 Alexis 见到了 Gupta 以及地图团队的技术主管 Micheal Weiss-Malik。Micheal 原来是 NASA 的工程师,他 20% 的时间用在了 Google 火星地图上。

Micheal Weiss-Malik 向 Alexis 讲述了他们构建地图的过程。这需要许多步骤,从合作者那里获取数据,将它处理成合适的格式,然后和其它源头那里获得的数据合并。做完这些工作后,还需要进行其它操作,使用工具来传入数据,最终产出高质量的地图。

当他们构建美国地区的地图时,首先使用了美国审计局的 TIGER 数据库。但是那些地图并一定完全符合实际情况。为此,Google 会把这些数据与其他来源的数据进行比对,比如美国地质调查局的数据,以及 Google 街景车获取的数据。现在,Google 街景是非常重要的数据源。街景车的行程已经达到 500 万公里,每次行驶都会带来有用的数据,包括实际路况和大量的图片。Google 会通过算法从拍摄的图片中提取出交通标识,甚至将它们贴到深层的地图上面。

我们可以把这些街景车和网络上的爬虫做类比,只是它们可以爬取真实世界的文字信息。通过计算机图片识别技术,Google 能够为现实世界做索引。Google 地图副总裁 Brian McClendon 认为,通过 OCR 技术,Google 能够将世界上各种真实文字信息组织起来。目前构建地图的过程中,Google 会从图片中提取街道名称和地址,但是这只是个起步。Brain McClendon 说他们有 600 万商业机构和 2000 万个地址的“视觉代码”(View codes),通过 logo 配对,可以找出公司标识所在的位置。他们能够对获取的图片进行辨识,进行语义化的了解。

不过,将街景地图直接转换为可用的信息仍然是未来的事情。要对地图的实际意义进行理解,仍然需要人工投入。比如要了解某个交叉口是否可以拐弯,仍然需要有人去看,可能是实际驾驶,也可能是通过观察街景车拍摄的图片。

Alexis 了解到,Google 地图中投入的人工是非常大的。根据 Micheal Weiss-Malik 的说法,要制作一个国家的地图,需要上百个操作员来处理数据,对地图进行实时更新。每天都有上千的用户报告问题,对于那些能够解决的问题,地图团队在几分钟内处理掉大部分。一个例子:某个用户报告说  Google 地图上没有显示某个边远地区新建的环形路。这时候,卫星地图仍然没有显示这个改变,但是一辆 Google 街景车最近从那里路过,拍下了这条新路。于是,Google 的操作员开始快速绘出这条新道路,并且和地图上已经存在的结构连接。这只需要几分钟时间。

在了解到 Google 地图的构建过程之后,  Alexis 认为没有其它公司能够像Google 一样获取如此大量的地理数据。这不仅是因为 Google  处理数据的能力,而且因为它能够投入大量的人力,去组合和清理数据。

可以想象,如此庞大的数据处理,对于任何公司都是不可能完成的任务。除了公司内部的操作员之外,Google 还要利用更广大的用户来帮忙。Google 的 MapMaker 产品就是一个这样的产物。通过 MapMaker,公众可以对 Google 地图进行编辑,这可以最大限度的利用人脑中的知识,将其变为互联网上的数据,Open Street 地图也是这样利用大众智力投入的。

未来的世界将是虚拟和现实结合的世界。这使得 Google 的地理数据成为最有价值的资产。对此,科幻小说家 Robin Sloan 是这样说的,“我认为这是 Google 的核心资产。在 50 年内,Google  将是一个自动驾驶汽车公司(由这个世界的深层地图驱动),哦,另外,他们在某个地方还有一个搜索引擎。”

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中