预测得了春运,分析得了车主,手机地图的数据从哪来?
1 月 16 日,高德地图联合全国近 50 家省市级交通管理部门发布了《2017 年春节出行预测报告》,报告内容主要针对全国范围内的高速公路以及城市拥堵状况进行预测,涵盖全国 18 个省(直辖市)及 30 个城市的信息。
高速正月初六最堵,城市除夕当天最顺
从预测来看,春运期间全国高速拥堵呈现“凸”型趋势。放假前的“回家高峰期”将出现在农历十二月廿二至廿六(1 月 19 日至 1 月 23 日),“返程高峰期”会出现在农历正月初五至初七(2 月 1 日至 2 月 3 日)。其中,正月初六(2 月 2 日)将成为春运期间最堵的一天。
(截图来自:高德地图)
此外,在全国范围内,京津冀、长三角、珠三角及成渝地区将成为春运高速最拥堵的区域。在四川、江西、湖南、安徽、湖北等省还会出现“团雾”现象(一种比普通雾更浓、能见度更低的雾,一般能见度仅有 10 到 20 米),影响出行安全。
从城市交通状况来看,春节前五日开始,全国主要城市的交通拥堵状况将出现明显的下降趋势,除夕当天全国城市的拥堵状况将达到最低值。从农历正月初四(1 月 31 日)开始,拥堵状况又将重新上升,预计到正月二十(2 月 16 日)将恢复到放假前的水平。
(截图来自:高德地图)
除此之外,高德地图还面向所有用户推出了“春运路况先知系统”,用户可以在页面中查询在农历十二月廿一至正月十六(1 月 18 日至 2 月 12 日)期间,任意日期的全国高速及北上广深等 42 座城市在内的道路拥堵状况。
据悉,查询到的信息可以精确到具体路段和以小时为单位的时间,并且通过融入全国天气预报数据,系统还综合研判出了春运出行受雨雪等恶劣天气影响的高速路段。
手机地图的数据从哪来?
从基本的位置信息,到道路状况预测,互联网地图服务的覆盖范围越来越广,这离不开海量的数据获取与分析。
一般来说,电子地图对实际空间的描述实际上是由不同图层数据的叠加来完成的。在所有的电子地图上,都会有一个包含了最基本地图数据元素(如道路、河流、桥梁等)的底图。在底图的基础上,可以根据不同电子地图的需求叠加不同的图层,如交通拥堵状况图、卫星图、POI 图层等。
(图片来自:Flat World Knowledge)
针对不同的图层,数据采集的类型、方法和渠道也不尽相同。对底图数据来说,一般有以下几个主要的数据来源:
- 官方地图:来自于政府相关部门的权威测绘;
- 实地外采:由测绘人员利用专业的仪器仪表在实地环境中测绘;
- 航片卫片制作:在自己拍摄或者购买的高精度航空、卫星、遥感照片基础上进行人为的矢量标注或勾勒。
在底图数据方面,国内的地图服务商此前主要依赖两家地图数据供应商——高德地图和四维图新。两家公司都具有国家甲级测绘资质,几乎囊括了包含航空测量、海洋测量、电子地图编制、互联网地图服务等在内的所有业务。
(图片来自:凤凰科技)
尽管市场上还存在其他具有测绘资质的公司,但这两家基本上垄断了底图数据测绘市场。如百度、苹果、Google 等的地图服务,有关底图的数据都主要来自这两家机构。
后来为了争取主动权,百度收购了同样具有甲级资质的长地万方,腾讯也收购了科菱航睿空间信息技术有限公司,加强在自采基础数据方面的能力。
在底图这种基础数据之外,叠加在上面的 POI(Point of Interest,兴趣点)数据来源就多元化多了。可以来自车辆或者人员的“扫街”拍摄,也可以来自地址反向编译(通过门牌地址号码及地图中的道路数据进行定位标注),或者从其他服务类网站、app 中(如大众点评、携程等)抓取数据等。
(图片来自:小白不菜)
高德地图此次推出的拥堵状况预测就来自这些被称作“活数据”的 POI 数据。据高德地图介绍,“春运路况先知系统”是基于高德地图的海量交通出行数据建立的,包括来自交通行业浮动车(出租车、物流车等)、高德地图用户的出行数据以及第三方合作伙伴的数据。其中,83% 来自公众数据,17% 来自行业数据。
根据艾媒咨询统计数据,截至 2016 年第三季度,我国手机地图用户累计规模已达到 6.54 亿人;另据 QuestMobile 统计,2016 年 12 月,我国地图导航类应用月活跃用户达到 4.819 亿,同比增长 47%。
基于海量的用户出行及其他服务情况,地图服务商可以抓取丰富的用户数据。在高德地图近日发布的《2016 年度中国主要城市交通分析报告》中,分析用到的数据就包括用户出行、车辆类型、目的地等信息。
在 POI 这种“活数据”方面,供应商一般没有什么资质的限制,因此来源五花八门,数据也更加个性化、多元化。
作为国内最大的两家互联网地图服务商,高德地图和百度地图在“活数据”的争夺方面日益激烈,却也各有侧重。基于较强的数据测绘采集能力,高德地图的数据多以自产为主,并且背靠阿里巴巴,可以获取阿里旗下产品的用户数据;百度地图虽然也间接获得了测绘资质,但是仍主要依靠其他平台和数据商。
(截图来自:艾媒咨询)
目前高德地图的数据来源包括用户端、出租车公司数据以及阿里系的电商物流数据等,并且通过与交通管理部门建立合作,获得了官方的交通出行数据。从长期发展来看,高德地图更加注重打造 LBS (Location Based Service,基于位置服务)系统,将基于地图数据的预测分析能力,对交通管理、城市规划以及线下的实体经济提供数据服务。
而百度地图则基于百度开放平台,联合深耕 O2O 领域的服务。目前,百度地图覆盖了全国近 400 个城市、数千个区县;在百度地图中,可以查询到附近的商户、学校、生活服务等信息。
当你的一切都被“大数据”了,隐私安全怎么办?
地图的数据来源多元化了,一方面可以给用户带来更精准、个性化的服务;另一方面,却也给用户信息安全带来了威胁。
1 月 10 日,高德地图联合数家研究机构发布了《2016 年度中国主要城市交通分析报告》。除了日常的数据之外,报告还列出了“不同品牌车主爱去的场所”、“出行爱好”等画风清奇的信息。根据高德地图的数据,英菲尼迪车主爱去整形医院、凯迪拉克车主则更“青睐”洗浴桑拿场所。
比起前面提到的《2017 春节出行预测报告》,这份报告的信息量实在是太大了。从道路交通状况到个人出行、驾车行为,用户的一举一动仿佛处于“监控”之中,被一滴不露地抓取并储存在数据库中。
(图片来自:NPR)
除了车主的出行偏好,高德还曾在 2016 年 6 月与 blued、一点资讯等机构联合发布了《全国首份同志兴趣图谱》。基于各平台的用户数据,机构给出了抓人眼球的报告,但这种离用户隐私有点近的数据分析,到底能不能保障用户的数据安全呢?
如今,智能手机正逐渐成为新的生活必需品。而当用户在使用手机上安装的各类生活服务类应用时,大多不可避免地要将自己的隐私信息提供给各平台和软件服务商。一方面,用户能够享受到基于海量数据的更精准细致的服务;另一方面,用户可能会担忧自己的信息被暴露或者滥用。
对于采集用户数据的服务商来说,大数据是提供服务的基础,但也应该留意把对数据的运用控制在合理的范围之内。
题图来自:The Windows Bulletin