腾讯 SOSO 街景地图:让地图更“真实”的理想
今年 5 月腾讯搜搜街景地图 Beta 版停止运营的时候,引起的关注比它去年 12 月 26 日上线的时候大得多。这也符合新闻的传播原理。
如今这款产品计划本周重新上线。在正式版上线之前,爱范儿独家受邀体验新版产品,并对搜搜街景地图产品总监进行采访。
在离开大众视野的半年时间里,搜搜街景团队做了两件事情:清除原先街景地图中的敏感信息(如道路限高限重等),与政府部门共同制定街景地图监管政策;扩大地图数据采集,产品总监张弦介绍“现在的数据是之前的 10 倍”。在即将上线的版本中,会放出北京、上海、广州、深圳、拉萨、西安六个城市的街景地图,其他城市还在审批中,审批完毕后会陆续上线。未来他们也会做到一年更新一次街景地图(在我看到的数据中,最新有 2012 年 11 月更新的数据,最早有今年 3 月的数据)。
街景地图概念是 Google 最早在 2007 年提出来的,那一年,国内的创业团队 City8 也开始推出街景地图。Google 街景地图从诞生之日起饱受隐私侵权困扰,但它的街景采集车现在仍然没日没夜地在各个城市采录数据,目前已经将触角延伸到了大峡谷和海底。另一地图大佬——诺基亚也在今年 11 月份向欧美派出 TrueCar 街景采集车。
腾讯搜搜地图团队立项做街景地图是在 2011 年 5 月,在此之前还筹备了几个月,开发半年之后在 12 月正式发布产品,并在今年 4 月发布了手机端产品。目前街景团队包括产品、开发、技术在内总共 50 多人(不计配套的运营人员)。除了实地采集外包外,这些工程师要处理从标记整理硬盘、数据录入到数据后处理各个环节,其中数据后处理是指图像拼接、优化、压缩、匹配和切割上线。
腾讯没有自己去采集数据,而是采用订单制,由第三方采集公司来完成。据说一年采集的数据量高达 1 PB(1PB=1000TB),光是整理硬盘,搜搜就专门配备了两个人。由于涉及商业保密,张弦没有透露这些采集公司的名字,只是说“关系很紧密”,腾讯与这些公司之间签署独家协议,街景数据向搜搜独家供应。这些外部采集团队的规模约为“两三百人”。张弦介绍说如果他们工作状态饱和的话,即从上午 10 点到下午 4 点,一个采集车可以采集回来约 20GB 数据,这些车队一天总共可以采集回“几个 TB 数据”,一年加起来有一个 PB。
我在腾讯北京的办公室里体验了这款即将上线的产品。从实景采光效果来看,搜搜街景的 360 度照片确实非常透彻明亮,显然是经过刻意筛选的。张弦介绍说只有 30% 的天气适合拍街景,他笑称自己是“靠天吃饭”。在体验过程中,他还特意翻出一张上海的夜景(题图),是夜色降临,华灯初上的时候,看起来气势磅礴,他说这就是“魔都”。在搜搜街景地图上,橙色表示有夜景的区域,蓝色表示街景覆盖到了的区域。就北京地区来说,搜搜街景地图已经覆盖到了六环以内的城市支线,所谓“城市支线”是指地图比例约在 150 米比1 的时候呈现出来的道路网。再具体到小区内的街景则无法显示。
张弦说就要做到更大比例、更清晰的街景,至少需要多花一倍的精力。“就像人的毛细血管比动脉血管还多,做街道的街景并不比做城市支线的街景简单。”他说搜搜在五环外的回龙观小区做了一些实验,“工作量非常大”。
我今年 11 月在参观高德位于北京昌平的数据中心的时候,了解到他们的外采人员在采集 POI 信息的时候会遭遇驱逐的情况。张弦说搜搜的外采车辆也有类似的经历,由于一些学校不让他们的车辆进入,他们目前采集到 66 所大学校园的街景。但校园街景很受欢迎——这是完全能理解,以前 Google Earth 尚且能够撩拨人们的爱乡之情,更不要说更加清晰的街景。搜搜地图除了校园街景外,也覆盖了众多著名景点,如故宫、颐和园、兵马俑、布达拉宫等,由于这些地方无法进入车辆,均是由人工徒步完成。
我认为街景的应用场景分为三个层次:娱乐,工具,服务。
- 娱乐。娱乐应用是满足一种新鲜感,让人觉得好玩。比如 Google 街景刚刚推出的时候,我们去查看白宫、去查看拉斯维加斯等等。
- 工具。工具应用是指街景地图成为一种“真实的”地图工具。以前我们只能在二维地图上查询地名,到达之后需要进行精确导航。如果以后我们查询地图都可以以街景显示,那么你对周边的环境一下子就一目了然。
- 服务。服务属性是指利用街景为商业或公共活动服务。比如图书馆内的街景(Google 街景已经开展该项目),比如中介机构用街景展示租房信息、酒店用街景展示住房条件、餐饮用街景展示用餐环境等等。
目前的街景服务,除了 Google 的一些公益项目外,大多停留在“娱乐”层面。搜搜地图街景也以娱乐为主,且由于与高德底层地图的匹配做得并不完美,POI 信息缺失,一些城市支线附近的街景无法通过搜索获得,需要在二维地图中搜索到精确位置后,再打开街景功能,通过缩放以寻得最终目的地的街景画面。这对于用户习惯来说,是一个不小的挑战。加大 POI 信息点的标注即可解决这一问题。
搜搜街景地图在使用体验方面有待完善的地方也有不少,比如在前行或后退时,跳跃感比较强烈,会找不到自己处在哪个位置。据张弦介绍,造成这种感觉的原因主要是他们的数据不是连续性的,而是断点的。“如果做到连续效果,数据量太大了”,张弦说,“一张 360 度角度的街景,我们采集下来的数据有 50M,分割上传到 Web 后约为 600K,手机上的大小我们控制在 200K”。他说压缩技术是自主攻克的,搜搜自主研发的还有户外采集设备。“普通商用采集设备价格为 400 万-500 万元人民币不等,我们自己开发的设备成本约为它们的十分之一”,张弦说。
对于 Google 街景饱受诟病的侵犯隐私指控,搜搜的回应是“非常重视隐私保护问题”。在实际体验中,我注意到搜搜对街景中的私家车牌、人脸等做了遮盖和模糊处理。据说通过程序自动遮盖人脸的命中率可以达到 80%,而车牌的命中率可达到 90%;在程序处理完后还会有人工审核。“如果确实发现未处理到位的,用户可以在网面提交问题,我们会第一时间作出响应”。——除了提交问题外,用户(个人或商户)还可以“邀拍”,搜搜街景地图团队依据用户的呼声来拍摄更精细的街景(其计划在明年覆盖到全部省会城市,未来几年覆盖到 300 多个地级城市,精细化耕作的优先级并不是最高)。
而在被问到街景地图所面临的困难时,张弦说困难来自三个方面:街景地图管理政策,天气和海量数据。第一个问题原本是行业的空白,但随着腾讯加入后,引起监管部门注意,并发生 5 月的停运事件。但目前这个问题基本得到解决,腾讯凭借自己强大的关系,成为街景地图监管政策的推动者之一,可谓因祸得福。第二个问题如前所述,为了获取更好的街景照片,他们只能“靠天吃饭”,这一点 Google 街景团队也概莫能外。第三个问题是数据量的存储。每年处理 1PB 数据对于腾讯来说是一个巨大挑战,据张弦介绍腾讯公司已经为街景地图投入了“数亿元”人民币。
在采访的最后,我问张弦当初为什么要做街景。他的回答是:
LBS 是手机(移动互联网)的标配,它会是平台级的产品。腾讯有地图技术平台,在地图业务之上,我们判断街景是未来地图发展的一个方向。这个方向就是——真实。它解决了“真实性”问题。现在的地图无论怎么做,都做不到街景那样图片化的呈现方式。我们致力于让地图更加简单易用。我们在做街景之前,评估了有做的可能性和可行性。当然,我们也考虑到差异化竞争的需求。国内其他公司一时半会不会这么有决心去做——它花的人力、资金非常大。
这一答案与马化腾的言论高度统一。马化腾自今年 5 月首次在移动互联网大会上提出四大战略方向(SoLoMo、照片、Voice、手机安全),其中提到腾讯开放平台每天调用 LBS 数据的次数是 5000 万次。到了 10 月份,这一数字更新到 7 亿次,可谓暴涨。街景地图的布局,如同腾讯 5 亿元影视投资基金,都属于长线投资。参考 Google 在街景地图方面的雄心及由此获得的声誉,腾讯在国内街景地图市场的野心可见一斑。