打造有趣的机器人营销账号

公司

2012-05-29 15:00

微博和 Twitter 都充斥着海量机器人营销账号,一旦你发出的信息包含它们所针对的关键词,就会引来大量 @。不过也有不那么招人讨厌,甚至可以算得上有趣的机器人营销账号。年初开始走红,引来很多科技媒体报道的 Twitter 账号 @Horse_ebooks 就是一个例子。

@Horse_ebooks 每天最多发十来条推,从不用 @ 骚扰没关注自己的人。它所发内容基本都是随机从互联网上摘取后拼接的短句,平均每发四五条推就会夹杂一条带电子书销售链接——基本都是些丢亚马逊根本没人会买的书。@Horse_ebooks 目前已经有超过 75000 人关注。那些随机生成的无意义短句本是防止 Twitter 监测垃圾账号的手段,现在每条都引来很多人类账号回应。

《纽约时报》高级软件架构师 Jacob Harris 也被 @Horse_ebooks 所吸引,他用自己的业余时间打造了一个可读性更好的机器人账号 @nytimes_ebooks。Harris 在自己的博客解释了实现方法:

  • 抓取《纽约时报》网站的 RSS feed;
  • 通过代码自动抓取文章全文(《纽约时报》的 RSS feed 仅输出摘要);
  • 摘取报道中打双引号的人物原话,这些内容一般比较精彩;
  • 把这些话输入 Markov Chainer,将句子打散成短语;
  • 调整文本以匹配 @horse_ebooks 的文风——以空格代替标点符号、如果有介词就截断最后一个单词;
  • 当然,最后还要加上短链接,让读者直接看到链接来源是《纽约时报》。

最终结果很不错,而且有些句子被重组后甚至符合文章原意,比如 “赢得民心、不穿防弹衣(winning hearts and not wearing body armor)” 所指向的文章说的是海军一师 2004 年进入伊拉克以后的情况,当时不少陆战队员以为这是一次友好的军事行动。“Winning hearts and minds” 这句话可以追溯到南北战争,从越战开始就很常用。

有些就比较费解,比如 “Growth isn t the core value holding the strategy it” 说的是律师行 Dewey & LeBoeuf 申请破产保护

不过说实话,即便知道 @nytimes_ebooks 发的推都是随机凑出来的,我还是很想点进去看看文章到底在说什么。看来得考虑做个 @ifanr_ebooks。

 

题图来自 Thomas Hawk

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中

关注电子阅读、任何有趣的设备、IC 以及“历史的草稿”,相信移动设备与互联网的结合正促成近百年来最重要的一次变革。

本篇来自栏目

解锁订阅模式,获得更多专属优质内容