数据是不是互联网的「石油」?
数据是互联网时代的石油,这个说法并不新鲜。
早在十三年前,英国数学家 Clive Humby 就曾说过数据是新时代的石油。「它很有价值,但如果未经提炼,那数据也无法展现自己的价值。它必须变为天然气,塑料,化学品等,变为一个商业产品才能有价值。因此,我们必须对数据进行分解和分析,数据才能有价值。」
我们都知道,石油这种不可再生的资源是引发过战争和争端的。而在今天这个数字时代,数据也会引发争端。
一方面是个人隐私和大公司之间的博弈,地位和体量的较大差异让个人的隐私数据被一再入侵,直到舆论引爆网络,大家开始维护自己的个人数据。另一方面则是国家、公司、组织和服务提供商的博弈,关于数据归属权和使用权,谁都不愿让步。
▲ 图片来自:World Economic Forum
上周有消息称,美国的制药公司出售了数百万的英国国民保健服务(NHS)患者相关数据。而这还只是英国医疗信息泄漏的一部分,根据亚马逊与政府签订的合同,亚马逊可免费访问 NHS 收集的诸多医疗信息。尽管这些信息不包括具体的患者数据,但庞大的数据信息库依旧可以帮助亚马逊制造或销售自己的商业产品。
今年七月,英国卫生大臣 Matt Hancock 曾表示,亚马逊与 NHS 的合作将会让 Alexa 设备向用户提供专业的健康建议,这能减轻医生和药剂师的压力。但众人所不知道的是,亚马逊甚至可以与第三方共享信息。他们还可以用这些数据创造新产品、新应用,新的云服务或分布式软件,而 NHS 则不会从这些商业产品中获益。
《卫报》将这一事例称为公共数据的最大威胁。
英国国民保健服务体系(NHS)拥有世界上最有价值的数据库之一。他们的基础保健记录涵盖了数十年来 5500 万人高质量数据,这些数据很可能涵盖了千万人的健康历史记录。在这些数据中,有 2300 万份护理记录记述了患者接受专科护理时阶段性治疗的过程。
安永会计师事务所估计,这些数据的年价值为 96 亿英镑。对制药公司而言,这些综合数据比任何样本都更有价值,像 NHS 这样的高质量的数据库就像是一座金矿。
必须有足够多的新数据,智慧医疗和 AI 辅助医疗等科技产品才能够进行深度学习,从而创造出自己的价值。而随着这些新技术对医疗研究的作用越来越多,NHS 这类数据的价值只会随着时间的推移而增加。
▲ 图片来自:Railmonitor
而在数据泄漏中可能暴露个人隐私数据的隐患之外,有越来越多的人开始关心数据的经济价值。
如果我们可以从数据库中创造新产品,那新产品是否也与数据库中成千上万的数据提供者相关?公共政策研究所的副研究员 James Meadway 认为,如果此类公共数据帮助了某一商业产品的诞生,那这个产品的价值就不应该属于某一公司或私人组织。
我们应该寻求建立一个「数字公地」,将我们从公共数据中获得的价值交给创造这些数据的公众,而不是将其私有化。
▲ 《经济学人》曾提出数据已成为最有价值的资源
这不是聪明的大脑中现在才在思考的事。加利福尼亚州州长 Gavin Newsom 就曾提出了一项雄心勃勃的「数据红利」计划,通过该计划,Facebook 和 Google 这样的大型互联网公司将向用户支付一部分来自用户数据的收入。
Facebook 的联合创始人 Chris Hughes 也有类似的想法,他在文章中举例论证时提到了因石油而诞生的阿拉斯加永久基金。阿拉斯加每年会把至少 25% 的矿产租金、专营税、联邦矿产收入分享金及州政府收到的奖金放进永久基金,再作为分红分给其居民。Chris 认为互联网公司与阿拉斯加一样,他们都站在个人数据之上获益,所以他们获取的利润也有部分应归属于个人。
反对者则并不认为数据是互联网时代的石油。
因为石油是有限的资源,而数据是无限的、可重复使用的。「我们如果不去挖掘它,那它就不会有足够的价值。」
在反对者看来,如果我们真的要把数据看作是一种能源或燃料,那将它类比太阳能、风能和潮汐能等可再生能源可能会更合适。
地球上有大量的碳,比我们所能使用的还要多,我们应该考虑如何让每个人都能更广泛地获得碳。而不是把碳隔离起来,减少碳的供应。
题图来自 David Parkins