Knowledge Vault:Google 将建全球最大知识库
随着知识图谱的出现,Google 搜索不再是简单的网页链接,而是直接回答问题的知识引擎。不过,现有的知识图谱仍然依赖大型合作知识库 Freebase,信息的扩展是众包形式。这限制了它的发展速度。现在,Google 决定将这个过程自动化。
据 newscientist 网站报道,Google 创建了名为 Knowledge Vault 的知识库。它通过算法自动搜集网上信息,通过机器学习把数据变成可用知识。目前,Knowledge Vault 已经收集了 16 亿件事实,其中,2.71 亿件是“可信的事实”。这里的可信是说,Google 把新事实与已掌握知识对照后,认为其准确的可能性是 90%。
“他们完成的是一件非常惊人的事情”,法国 Telecom ParisTech 的数据科学家 Fabian Suchanek 说。
Knowledge Vault 仍然没有知识图谱庞大,但是,它在扩充知识上是快速和自动的,超过知识图谱只是时间问题。Garntner 的技术分析师 Tom Austin 说,大型科技公司都在构建类似的知识库。当机器系统掌握了全人类的知识,它的智力将远远超过现有的智能助手。“在这个十年结束的时候,我们将会看到智能的优先收件箱。它能够给我们找到最重要的 10 封邮件,然后在无需我们打扰的情况下,处理完剩下的邮件,” 他说。
除了改善人机交互之外,知识库也会推动现实增强技术的发展。未来,Knowledge Vault 可以驱动一个现实增强系统,让我们从头戴显示屏上了解现实世界中的地标、建筑、商业网点等信息。
知识库还能够改变我们研究人类社会的方法。“这是最有远见的事情”,Fabian Suchanek 说,“Knowledge Vault 能够建立历史和社会的模型。”
Suchaneck 已经做了一次以数据驱动的历史研究。他把 YAGO 数据库与法国报纸 Le Monde 的数据结合,展示了性别差距在政治界的历史变化。
由于 Google 的知识库是详细和庞大的,我们甚至可以对未来做出一些精准的预测。“这是全新一代的技术,可以带来巨大的改变,改善人们生活和娱乐,甚至改变他们战争的方式,” Austin 说,“这是一个量子级的飞跃。”
Knowledge Vault 带来的也有隐私问题。它贪婪地收集任何可以找到的信息。“在幕后,Google 不仅仅有公开数据,” Suchanek 说,“它也从 Gmail、Google+ 和 Youtube 上收集信息。你我存储在 Knowledge Vault 的方式,与 Elvis Presley(猫王)相同。”
图片来自 neoteo