算法比你还了解自己?胡扯
网络冲浪时,你一定曾刷到过这样的测试题,根据输入习惯来测性格,比如输入「ysbg」,候选词是一丝不苟还是一丝不挂,前者证明是个正经人,后者则不是。
测试的原理很简单,手机输入法会记住你的输入偏好,因此候选词一定程度上可以反映一个人的性格,算法比你自己更懂你。
我劝你别信,这不过是新时代的「电子迷信」罢了,打出「一丝不挂」不一定是不正经,这个锅应该算法来背。
输入法的候选词预测功能,原本是为了提高输入效率,但在算法的介入下走向了「歧路」。
算法预测,不一定和你有关
经历过功能机时代的人,可能都会有这样一个共同回忆,老师在黑板上挥动粉笔,你在课堂下揣兜,发出轻微的抖动。
嗡嗡嗡,一条短信就这样发出去了,盲打手机键盘是高阶手机玩家的专属技能,也是学校朋友圈的社交门槛之一,这背后就输入预测功能。
手机输入法从计算机延伸而来,全键盘的输入效率很高,但要求输入完整拼音,对于手机这种小巧且经常单手操作的设备而言,并不是非常合适。
▲ 黑莓全键盘手机,曾以效率高闻名.
手机出货量越来越高,输入麻烦的问题就越发严峻,好在永远有人能从产品体验中找到赚钱机会,Tegic Communications 公司开发出 T9 输入法,摩托罗拉为了与之竞争推出了 iTab 输入法。
这两种输入法的共同特征是都为手机键盘设计,支持 9 键,同时带有输入预测功能,不仅能根据已经输入的文字调整候选词,还能根据人们的输入习惯调整候选词顺序。
比如按下 7 键(wxyz)和 9 键(qprs) ,候选词会出现「我是」,进而候选词又会优先显示姓名。
根据输入习惯调整候选词顺序的认知,在功能机时代就已经形成,今天社交平台上的「输入法测试」,不过是又一次社交轮回,我们还在重复十年前的事。
有趣的是,随着短信被各种互联网服务取代,让你打字更快的输入法,在输入预测方面进化出了新功能——算法预测和热词推荐,且破坏了自功能机时代就形成的认知,输入候选词不一定和你的输入习惯有关。
比如「yyds」的候选词原本应该是一衣带水等词,在网络文化的影响下,「永远滴神」在候选词中排序越来越靠前,这和你的输入习惯没有任何关系。
热词推荐选取的热词,往往来自各种网络流行文化,今天是 YYDS,明天是绝绝子,之后还会有更多。
iPhone 默认输入法的输入预测功能,甚至会参考 Safari 浏览器的浏览记录。
▲ iPhone 键盘. 图片来自:9to5Mac
输入「ysbg」,候选词中有一丝不挂,并不是你不正经,可能是陈奕迅的歌太火,又或是作为陈奕迅的粉丝,你听过这首歌。
为了让你输入更快,输入预测越来越智能,但人们的固有认知并没有及时更新,导致不少人替算法背了锅。
如果不想某天输入候选框,窜出奇奇怪怪的词,还是直接关闭热词推荐等功能比较好。
信息流的误解
比起输入法预测,信息流资讯应用和短视频应用更像是「算法比你更懂你自己」的原教旨信徒,每一款信息流应用都力争将如山如海般的内容,通过算法算法推荐,准确地推送每一个人的手机屏幕上。
然而,理想和现实总是会有距离,你可能有过类似的遭遇,刷着新闻或短视频,信息流突然出现一条一言难尽的八卦内容,刚好又被朋友看见了。
不出意外,朋友脸上很快会浮现「原来你是这样的人」的表情,满是调侃与嬉笑。
又一次,你替算法背了锅,它并没有那么懂你。
信息流算法推荐只是在推测你的喜好,它并不能完全真实反馈出喜好,尤其是初使用期间,当没有用户数据参考,算法会如何推荐内容呢?
作为日常接触大量电子设备的编辑,我有一个切身体验,每次换不同型号的手机,第一次打开 B 站必然会推荐相关机型的内容,有时是评测,有时是产品介绍。
算法推荐内容和平台氛围、热门内容也有不小的关系,UC 震惊体、标题党的认知,很大程度上来自平台部分热门内容,即便后续有所改善,但印象一旦形成要再改变,可能要付出数十倍的努力。
▲信息流资讯应用里的标题党文章
算法推荐,最终还是要平台内容供应。
即便是算法推荐广为吐槽的问题信息茧房,也有有着两面性。
美国学者凯斯·桑斯坦在《信息乌托邦》一书中提出了信息茧房的概念,即人们关注的信息领域会受个人兴趣引导,丰富的内容不一定能扩大认知,反而会让人持续形成偏见,陷入到「茧房」当中。
▲ 凯斯·桑斯坦. 图片来自:wiki
人的兴趣是不断变化的,主动训练算法其实可以带来意想不到的效果,编辑部就有一位梁姓编辑,将小红书用成了「插画灵感」平台。
她有意地不点击吃喝玩乐类内容,而只会点赞、关注、进一步浏览插画类内容,且保持每日 30 分钟,很快小红书信息流主页就基本都是各式各样的插画了,便于学习了解。
▲ 梁编辑的小红书首页
在梁编辑看来:纯粹依靠算法推荐喂养自己接收到的信息无疑是有风险,极有可能陷入到盲从、偏见当中,主动从兴趣出发选择内容,是扩展信息领域和自我认知的新方法。
算法推荐上瘾,其实比信息茧房更严重。
算法黑盒不开,误解不止
算法就像是一个黑盒,我们只能远远的看见黑盒表面,无法看破其中的奇妙之处,一知半解再加上算法推荐的高效,自然会不断引发误解。
▲ 图片来自:TechTalk
微博被广泛认为是娱乐八卦中心,吃瓜群众不亦乐乎时,也有不少人选择逃离,但其实微博也是社会新闻的集散点,大量社会新闻在微博发出、发酵、影响。
提及小红书,吃喝玩乐是大多数人的第一印象,但正如上文梁编辑的亲身经历一样,通过持续主动地训练,小红书也可以成为一个质量颇高的插画创作灵感平台。
2018 年,字节跳动曾向公众揭开了算法黑盒的神秘一角,公布了《今日头条》的推荐系统原理。
▲ 图片来自:环球网
算法基于三个维度的数据调整内容分发,比如内容特征指的是系统分析图文、视频、微头条等类型内容的特征;用户特征则包括兴趣标签、职业、年龄、性别、机型等;而环境特征则包含地点环境,人们的行为(工作、旅游)等。
点赞、关注、阅读都会影响算法最后分发到每一个人屏幕上的内容
听起来似乎很好理解,但这不过是一个定性的介绍,而非定量分析,三大特征影响占比总是在不断变化,一套算法也不能满足所有内容的个性化分发。
内容推荐算法是一个内容平台的核心,同时也是其商业命脉,技术和原理双门槛,能拦住不少试图猜测算法谋利的黑产,做号党一旦完全了解平台的算法,完全可以通过内容赚取大量流量收益,这并不是平台所想看见的。
即便打开了一角,内容平台的推荐算法对于绝大部分人而言,还是一个黑盒,只能远观表面,而不能深入了解,未知带来的误解也就不会停止。
但至少,下次你可以甩锅给算法,一个工具,怎么可能比你还了解自己呢。