关于搜索引擎的一些往事

特稿

2011-05-23 10:34

1996 的时候,Larry Page 并不是唯一一个意识到可以利用网络上的链接结构有效改进搜索引擎的人。

至少还有两个人发现了这一点。其中一个是计算机工程师 Jon Kleinberg。

1996 年夏天,他来到 Almaden 的 IBM 研究中心攻读博士后学位。Jon Kleinberg 发现当时的搜索引擎在获取信息上极为低效,充满垃圾信息。

“不断出现的抱怨”Kleinberg 说,“是搜索不起作用。” 但是他直觉的意识到一种更有效的方法。“当时根本得到利用的一个事实是,万维网的网络特性,” 他说,“你会发现人们在学术著作中谈到应该利用链接的优势,但是 1996 年的时候没有人去那么做。”

Kleinberg 开始了自己的试验,由于缺乏时间、帮助和足够的设备,他使用了当时的 AltaVista 引擎,收集前 200 名的搜索结果,以此为基础探索通过链接获取有效信息的方法。

Kleinberg 将自己的突破在 IBM 内部进行了展示。很快,他的主管让他与专利律师接触。许多人开始注意到他的工作,在搜索信息上寻求他的帮助,甚至那个专利律师也要求 Kleinberg 帮他搜索业余爱好方面的信息。

到了 1997 年的时候,IBM 的副总裁们都来看这个东西,想搞清楚他们能够用它干什么。最终的答案是……做不了什么。

IBM 当时的营收超过 700 亿美元,很难看到一个关于网络链接的搜索计划能带来什么。Kleinberg 也没有以此盈利的想法,他的计划是去康奈尔大学(Cornell)教授计算机。

通过在斯坦福的朋友,Kleinberg 了解到 Larry Page 的计划。1997 年,他们在盖茨大楼(Gates Building ,以 Bill Gates 名字命名的建筑) 见了面。Kleinberg 发现两个人的目标很不相同。Kleinberg 思考的是如何通过链接判断一个网页的权威性,而 Page 更在意人们搜索网络的方式。

我们的核心观点是一样的,但是我们在利用它达到什么目标方面几乎是截然不同。

Kleinberg 与 Google 保持联系,1999 年和 2000 年他两次拒绝了去 Google 工作的机会。他在康奈尔很开心,喜欢从事学术和教育工作。他并不想成为亿万富翁。

另一个发现了类似算法的人是一个中国的工程师:李彦宏。1987 年他开始在北京大学学习,北京大学的学术地位是靠一种算法来决定的:科学引文索引。

“北京大学,因为教授的论文获得引用数量最多,获得了第一名的地位。” 李说。

1991 年,李来到美国,在纽约州立大学研修硕士学位。1994 年他在道琼斯的一个部门任职。他工作的一部分是改进信息获取过程。他试过了当时的搜索引擎,发现这些引擎低效而充满无用信息。

1996 年 4 月,他去参加一个学术会议。由于会议本身很无聊,他开始思考如何改进搜索引擎。这时候,他意识到,科学引文索引可以用到互联网上。

“当我回到家,我开始把这个想法记录下来,意识到这是一个革命性的主意。” 他说。他设计了一个搜索方法,通过链接的频率和被链接文本的内容来判断相关性。他把这个系统叫做 RankDex。

他把自己的成果告诉了道琼斯的主管,并催促公司去申请专利,结果无人在意。

“好几个月之后,我决定自己去写专利。” 他买了一本关于为程序申请专利的自助书,并在 1996 年 6 月的时候申请了专利。当他将这份专利交给道琼斯的时候,道琼斯找了一个律师来看这份专利。并在 1997 年 2 月对专利重新进行了申请。(斯坦福大学直到 1998 年 1 月才为 Larry Page 的 PageRank 申请专利)。

只是,道琼斯对李的专利并不重视。

“我试图去说服他们这件事的重要,但是他们的生意与互联网无关,因此他们毫不在意。” 他说。

李辞去工作,加入了西岸的一个搜索公司 Infoseek。1999 年,该公司被迪斯尼收购,随后,李回到了中国。

世事难料,总是充满着意外和转折,如果当初 Kleinberg  和李的想法得到了大公司的重视,今天的互联网格局是否会有所不同。这只能猜想了。

Via Steve Levy’s “In the Plex

后评论

评论在审核通过后将对所有人可见

正在加载中