十年前的网络搜索与突发新闻
十年前的 9/11 事件改变了很多人的命运——或许也改变了搜索巨人对新闻的态度。
那会儿 Google 公司正式成立不过 3 年,已经打造出全世界最大的搜索引擎,首页骄傲地写着“搜索 16 亿个网页”。但当时 Google 搜索没有现在成熟,排名没有对突发新闻进行任何优化——这些内容上线没多长时间、缺少超链接,排名往往非常靠后。
9/11 当天,Search Engine Watch 对 Google 搜索进行过追踪。事发两小时后,以“World Trade Center”为关键词进行搜索,第一页没有恐怖袭击相关结果。这让得知袭击消息后前来寻找更多信息的人大失所望。
撞击四小时后,Google 终于作出响应,在主页增加一段内容,呼吁用户通过电视和电台获取最新信息——这段文字对于互联网先锋来说无疑是非常尴尬的。同时 Google 也在首页给出《华盛顿邮报》和 CNN 相关报道的链接,后者当时未能经受住激增的流量,只给了页面缓存的地址。但 Google 搜索结果依然不能很好地提供新闻信息。
直到恐怖袭击发生六小时后,以“World Trade Center”为关键词的搜索结果第一位依然不是恐怖袭击。不过这时 Google 已经人工在广告栏位(赞助商链接)加入恐怖袭击事件的消息,指向 www.google.com/currentevents,列出各主要新闻来源对 9/11 事件的报道。
根据 Search Engine Watch 的调查,当时其它搜索引擎表现更糟糕,唯一的例外是 Alta Vista。Alta Vista 当时已经和新闻追踪公司 Moreover 建立合作关系,Moreover 搜集到的新闻条目会第一时间融入 Alta Vista 的搜索结果。早在 Google 作出任何响应之前,用户在 Alta Vista 搜索“World Trade Center”所获结果中排序最高的就是飞机撞击世贸大厦:
Alta Vista 后来的发展比较可惜,这家公司 2003 年被 Overture 收购,几个月后随 Overture 被雅虎收购。就像很多被雅虎收购的公司一样,Alta Vista 的发展越来越差,搜索业务最终在今年 5 月被雅虎关闭,网站搜索直接跳转至雅虎搜索。
另一方面,不知道是不是 9/11 让 Google 意识到新闻搜索的重要性,公司首席科学家 Krishna Bharat 恰好就在那年晚些时候开发出 StoryRank 排序算法,针对还没有多少链接的突发新闻。和 PageRank 一样,它的搜索结果也没有经过人工干预。实际产品 Google News 2002 年开始 beta 测试,2006 年正式推出。现在 Google News 已经成为 Google 搜索的重要补充,自动聚合热点事件相关报道显示在前列:
题图来自 swisscan,内文图片来自 Search Engine Watch