Nuance 科学家:图灵测试不能反映人工智能的进步
1950 年,计算机先驱图灵在一篇论文中预言了创造出真正智能的机器的可能性,并且提出了一个测试:如果一台机器能够与人类展开对话,而不能被辨别出其机器身份,那么称这台机器具有智能。
今年 6 月 7 日,在英国皇家学会举办的“2014 图灵测试”大会上,一个名为尤金·古斯特曼的聊天机器人成功通过了测试。不过,有人很快对此事表示了质疑。他们认为,聊天机器人本身并不具备智能,只是通过聪明的脚本骗过了评委,而且,它冒充是一个来自乌克兰的 13 岁男孩,从而让人们忽视了一些古怪的回答。
从这件事本身,我们也可以看到,其实图灵测试本身也是有缺陷的。因此,在测试人工智能的时候,许多人已经开始使用新的方法,其中,Winograd Schema 挑战就是比较受欢迎的一种。在这个挑战中,计算机需要回答一些常识性的问题,展示在语句理解方面的能力。
据 GigaOM 网站报道,从 2015 年 10 月开始,专注于自然语音识别的 Nuance 将会赞助每年一度的 Winograd Schema 挑战,提供 2.5 万美元的大奖,以奖励那些赢得挑战的人工智能系统。
Nuance 自然语言和人工智能实验室的科学家 Charlie Ortiz 说,图灵测试用了聊天的方法,其主要问题是,它变得越来越像是骗术,而不是真正的人工智能。“从某种程度上说,图灵测试是开放的,而且太过宽容。很难测试出你是否取得了进步。” 他说。
另外,他还指出,日常的交谈中涉及到大量的常识,以及对周边世界的了解。Winograd Schema 挑战能够让研究员们测试人工智能在这方面的进步。至于这个测试什么时候会通过,他表示了谨慎的态度,“有人认为,这并不难,另一些人则认为,短期内还是难以通过的。”
Nuance 支持此项测试是有原因的。它曾经为苹果的 Siri 提供过语音识别技术,而且也通过智能助手方面的技术实现盈利。Charlie Ortiz 说,在将来,公司的人工智能系统会掌握特定领域的知识,并且把握具体的使用场景。“你的智能助手不会取代医生,” 他说,“但是,它能够帮助你做决定。”
图片来自 io9