Twitter 与 “土耳其机器人”

公司

2013-01-10 09:00

微博 140 个字所组成的信息洪流,事实上已经成为了众多消息的第一来源——比方说奥巴马在大选之后,也第一时间选择通过 Twitter 发布消息 “Four more years” 以及一张与自己妻子拥抱的照片,以感动选民。

Twitter 与手机的结合释放了人们采访、报道、评论的权力,不但促使数字时代 “公民记者” 的诞生,也催生了数字时代的读者,他们会第一时间搜索 Twitter 以获取某事件最新的进展,同时了解其他人的看法。

然而,当有什么大事发生时,在 Twitter 上搜索相关的消息依然让人摸不着头脑。原因之一是人们喜欢用 “双关语” 来表达自己的观点,人们在搜索的时候,得不到自己想要的结果。Twitter 官方博客以标签 #bindersfullofwomen 为例,如果但看字面意思,完全不知道它带有政治的意味。

于是,Twitter 打算通过 “人工” 的帮助,来改进搜索结果的质量。他们称这是 “实时人工计算引擎”,希望引入 “人类” 对搜索结果的判断,以改进搜索结果的质量。

具体做法是这样的:首先, Twitter 的后台会监控搜索关键字的趋势,第二,当后台察觉到新的搜索关键字之后,就会马上将之发送给 “人类评价者”,由他们来给这个新的搜索关键字来分类,或者进行补充,第三,由 “人类评价者” 所返回的结果,会第一时间补充到 Twitter 后台的系统中去。

为了保证人工的参与,Twitter 开发了新的 API 接口——Thrift API。通过该接口,Twitter 的搜索结果能够发送到亚马逊的众包平台 Mechanical Turk 中,由该平台将任务分包出去,并返回相应的结果。这意味着,以后 Twitter 的搜索结果里,有不少是通过 “土耳其机器人 ” 排序的,尽管机器与算法也在里面发挥相当的作用。

如果 Twitter 新办法真的能够提高搜索的精度,那么用户将更加喜欢使用,如前文所述,它已经成为众多消息的源头,人们喜欢在上面挖掘更多层面的内容。通过人工判断,Twitter 所积累的大量内容也能被有效利用起来,让人们直接找到自己想要的。

如果这种人工众包式的做法再向前一步发展会如何?ReadWrite 发出警告,称有了 API 所搭建的桥梁,以及亚马逊所提供的大量人工服务,Twitter 可以自行生产新闻。让我们回忆一下最近讨论得很红火的 “新媒体” 与 “传统媒体” 的分别,后者除了内容上依然有优势以外,时效性、与读者的距离等方面都已经有差距。现在,Twitter 不再是一个四处传播链接的机器,通过运用人力,自己为自己提供内容——那么一直以来利用 Twitter 作为传播渠道的传统媒体们,要如何应对竞争?

 

题图来自 FastCompany

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中