Google 的知识图表:明日搜索的基石
自从 Siri 发布以来,就有人指出它对 Google 搜索业务的威胁。从某种程度上说,Siri 也是一个搜索引擎,但与传统的搜索引擎不同,它提供的并不是大量的网站链接,而是问题的答案。
Siri 仍然存在种种不足,但是它易用、简明、人性化,代表着未来搜索的方向。当然,Siri 本身并不足以提供问题的答案,它只是一个先进的语义识别系统,其背后的知识来自于不同的信息源,其中就有搜索引擎 Wolfram Alpha。Siri 与 Wolfram Alpha 的结合并不奇怪。Wolfram Alpha 代表着搜索引擎进化的一个方向,它试图提供给用户问题的答案,而不是大量的相关链接,这种理念使得它与 Siri 的结合水到渠成。
以搜索起家的 Google 如何面对这种挑战?
多年来,Google 搜索的算法不断完善,但是其形式和技术变化并不大,其主要形式仍是搜索框(语音搜索未获得广泛使用),技术上仍然是根据链接数量和质量进行的页面排名。
很多时候,用户进行搜索时,需要的只是问题的答案,而不是寻找感兴趣的网站。Google 搜索在智能上仍然达不到知识引擎的高度。
在不久的将来,这将会得到改变。
我们曾提到 Android 团队正在开发一个语音前端:Majel。这可能会成为 Google 对 Siri 的回应。
Majel 来自为“星际迷航”中联邦电脑的配音演员 Majel Barrett。有趣的是,Google 用户体验主管 Matias Duarte 曾在 ICS 发布后提到过星际迷航。他将苹果 Siri 的理念比喻为“星球大战”,而将 Google 在语音上的理念比喻为“星际迷航”。
如果说 Majel 是知识引擎的语音前端,那么它的背后驱动是什么呢?
Google 的”知识图表“(Knowledge Graph)。
在接受 Mashable 网站的采访中,负责 Google 搜索的首席工程师 Amit Singhal 提到了 Google 正在构建的庞大的知识图表,这可能会实现他的梦想:一个 Star Trek 计算机。
”当你在公司内部有这样一个基础结构的时候,计算或者人工智能的所有层面都会得到改善,“Singhal 说,”你能够更好的处理查询或者问题,你向着构建 Star Trek 计算机的方向又进了一步。“
Google 构建知识图表的原因是关键词搜索缺乏智能,它并不理解用户所查询信息的含义。Google 的引擎知道”New”和”York”前后排列会突然改变两个单词的含义”,但它不知道 New York 是一个城市,拥有特定的人口和地理位置。
现在,Google 要将网页上的单词转变为带有相关属性的实体。“这是人类大脑自然的运作,但是对计算机来说,这叫做人工智能。”
2010 年,Google 收购了 Freebase,一个由社区构建的知识库。根据 Singhal 的说法,Google 在此基础上进行了大量投资,试图构建一个“相互关联的实体及其属性的巨大知识图表。”
从基于单词的索引转换到知识图表是一个根本的改变。Singhal 将单词索引比喻为书籍后面的索引,而“知识库更加庞大,更加精良和先进。”
目前 Google 的知识图表有超过 2 亿的实体,而且公司已经开始在搜索引擎中使用人工智能,但是许多人根本不会注意到。Singal 告诉 Mashable 网站,目前搜索方面加入的人工智能仍然属于起步阶段,相当于一个艺术家在 12 个月或 24 个月时候的创作。未来的发展是难以预测的。“我们正在构建一个’强子对撞机‘,从中能够产生什么粒子,我现在还不能预测。”
Google 的 Star Trek 计算机能否构建成功?这是一个没有答案的问题,但可以肯定的是,语音交互和知识图表将是 Google 未来搜索(或者说知识引擎)的基石。
Right,Majel ?