被遗忘权的崩塌:当 AI 可以通过你的朋友了解你
在智能推荐无处不在的今天,相信我们每个人都或多或少患上了隐私焦虑症。平时和朋友说话聊天都疑神疑鬼觉得手机在偷听,很多人也因此越来越不喜欢在社交媒体上发布信息了。
精准预测你的社交媒体行为,只需要9位互关好友
在研究中,研究人员收集了一万三千余个推特账号,这些用户分别都拥有150-200个好友。在好友中找到互动率最高的前9位并进行分组,将用户好友组中好友的行为数据以时间为线索进行分析。
数据科学家们通过研究得出,一般社交媒体用户,只要不是专注某一领域的KOL,通常在社交媒体上使用的词汇不超过5000个。如果用中文来比喻,大概就是「哈哈哈哈」「不转不是中国人」「我家哥哥太帅了吧」这些常规词汇。
也就是说,如果你微博好友都是战狼团,那么你也会和大家一起「虽远必诛」,如果你的微博是追星阵地,那么你也会深夜和姐妹们一起为idol打榜。一个人的网友圈子,决定了他的认知范围,也进而使得其行为可以被预测。
看来,人类的本质是复读机无误了。
圈层竖立起高墙,隐私在内部塌陷
自从桑斯坦的信息茧房假设被传播开以来,关于这一假设的认可程度其实长期处于不稳定的状态之下。尤其是近些年来社交媒体和个性化信息流的火热,更让很多人常常把信息茧房四字挂在嘴边。支持者认为算法推荐会源源不断的把符合用户兴趣的信息推荐给用户,最终导致用户认知闭塞,缺乏对世界的完整化理解。
其反对者认为,人天生就会对所接受的信息表现出兴趣趋向,即使是报纸和书本时代,人们也会选择自己感兴趣的内容来阅读。而这种选择并不会形成所谓「信息传播阻碍」「对外部世界的认知疏离」,所谓的茧房假说也不能成立了。
可佛蒙特大学在这次研究中提出了观点——人之于信息,很多时候不仅是兴趣选择,还存有社交选择。社交媒体上朋友的兴趣、语言风格、活跃时间与个人用户社交媒体行为存在的强关联,意味着一个人信息茧房是通过社交圈层搭建起来的,而这种茧房已经直接作用在用户的表达能力上,例如在研究中出现的一个有趣现象,越是对政治话题感兴趣的用户,在社交媒体上发言的词汇量越匮乏。某种程度上,这证明了信息茧房下的传播圈层障碍越来越明显,长期浸淫在某一圈层的人,不仅仅失去了接受其他圈层信息的机会,也失去了接受其他圈层信息的能力。
一开始人们对被遗忘权的要求还只停留在强制拍卖、失信名单这一类个人负面信息上,但很快相关需求开始变得越来越广泛。例如2013年左右曾经很流行一种工具,可以根据用户主页链接找到那些曾经被用户删除微博、豆瓣等信息,当时被很多人用来进行人肉搜索,以至于再次激起了人们对于被遗忘权的强烈需求。
到今天被遗忘权已经被写进欧盟的GDPR,注销账号、删除一切已经成了我们捍卫网络隐私的最后一条防线。可「好友算法」的出现意味着,只要对方能找到你的好友关系,即使你删去了一切内容,依然可以会将自己赤裸的展示在算法面前。
这也让Facebook这样靠探知用户信息盈利的企业可以在伦理上钻空子——假如一位用户坚持不给社交媒体授权数据权限,但他的社交媒体好友都向社交媒体开放了权限,社交媒体平台很可能会「合理合法地」绕过用户本身获取用户信息。
自我的副本
这种社交媒体预测算法也是一样,在同样的逻辑下我们几乎可以想象到:是否通过对一个主妇购物数据的分析,也能获知她丈夫刮胡子的频率?是否在职场社交软件上简单分析,就能获知一个人的工作能力和薪资水平?
在数字化生存和AI的共同作用下,「自我」的所有权已经形成副本并被无限分割,散落在那些一切与我们产生关联的地方——我们的朋友的喜好、我们家人的行为、我们爱人的一举一动……以至于从这些关联之中,也能挖掘出得碎片,还原出我们的自我。
面对这种可能,我们很难现在就为其下一个「好或坏」的定论。但这一次,让法律法规走在技术前面,或许是个不错的选择。
本文来自微信公众号脑极体(ID:unity007 ),爱范儿经授权发布,文章为作者观点,不代表爱范儿立场。