Narrative Science:让计算机像人一样写作

公司

2011-10-12 09:35

人工智能技术或许比我们大多数人想象中来得更快。

如果说 Siri 企图在信息输入上有所突破,那么 Narrative Science 的努力方向就是更加拟人化的 “输出”。过去,计算机 “写作” 技术只停留在利用庞大文本库所进行的简单拼凑。因此,生成的结果当然不尽如人意。

西北大学教授 Kristian Hammond 联手前 Double Click 管理团队的成员,Stuart Frankel 和西北大学计算机系和新闻系的精英们花费了两年时间在 2010 年共同研发出了新一代的智能写作软件 Narrative Science,将新闻报道和电脑工程进行了一次新世代的结合。

这个在学校实验室代号为 “Stats Monkey” 的项目,通过对给定主题的数据分析,会自动选择合适的写作角度,快速 “写就” 一篇具有标准新闻报道结构的文章。神奇的是,程序甚至可以根据不同的出版社特点用不同的行文风格 “写作”。Narrative Science 最初被应用在即时报道西北大学棒球和垒球的比赛中。自此以后,Narrative Science 也被应用在财经报道等领域,包括 Forbes 等网站都已经开始与 Narrative Science 建立了合作伙伴关系。

Hammond 教授认为 Narrative Science 的特别之处就在于满足了人们倾向读故事的心理。在此之前,虽然计算机已经拥有了强大的运算能力,可以图形化复杂的数据,却依然不能根据数据以自然语言输出成一篇人性化的文章。而 Narrative Science 就是为解决这个问题而设计的。当前,该程序的写作表现足以达到一位八年级学生的写作水平。

随着技术的持续完善,有业界专家大胆预测,类似计算机记者将在未来二十年内成为普利策(Pulitzer)新闻奖的有力竞争者。虽然 Hammond 教授始终在强调 Narrative Science 是在真正地进行 “创作(Composition)” 而非生搬硬套,仍有相当部分人对此技术持保留态度。在这群人中(相当一部分是记者),主要认为再先进的计算机算法始终也无法模仿人类的感性流露,这项技术最终只能生成低质量的数据报告式的文章。

同时,自动化写作也让诸如 Google 等在线搜索公司产生隐忧。如果程序已经能自动生成如此高质量的 “拟人化” 文章,那么辨别在线垃圾内容的任务将会变得异常艰巨。华盛顿大学人工智能的专家 Oren Etzioni 在谈及这个问题时,毫无掩饰地将 Narrative Science 比作数字化装备竞赛中的核武器。而 Narrative Science 则表示,他们不会将此技术转让/部署到这些网站中。

最后,我们提供了两段文字,其中一段就是 Narrative Science 自动生成的,你能分辨出是哪一段吗?请在下面的留言中给出你的答案。

A: “Michigan held off Iowa for a 7-5 win on Saturday. The Hawkeyes (16-21) were unable to overcome a four-run sixth inning deficit. The Hawkeyes clawed back in the eighth inning, putting up one run.”

B:”The Iowa baseball team dropped the finale of a three-game series, 7-5, to Michigan Saturday afternoon. Despite the loss, Iowa won the series having picked up two wins in the twinbill at Ray Fisher Stadium Friday.”

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中