在比赛做阅读理解上,人类第一次输给了机器

公司

2018-01-16 15:12

AlphaGO 的出现,让人类体会到了人工智能的强大实力。令人惊讶的是,它还在以恐怖的速度不断地进步着。

这一次,人工智能又以新的姿势刷新了人类对它的认知。在由斯坦福大学发起的 SQuAD(Stanford Question Answering Dataset)文本阅读理解挑战赛中,来自阿里巴巴和微软团队的人工智能模型分别以高分战胜了人类选手,位列榜单的前两位。

这是人工智能首次在文本阅读测试中战胜人类,意味着人工智能在自然语言处理方面已经达到了人类对语言词句的理解层次。

在这场阅读测试中,斯坦福大学的自然语言计算组会先从 500 多篇维基百科文章中抽取出大量的数据集(包含 10 万个问题),然后将一篇几百字(平均 100 字,最多 800 字)的文章给标注者阅读,让标注人员提出最多 5 个基于文章内容的问题并提供正确答案。

参赛者可以利用这个数据集进行模拟训练,并且通过开放平台来提交自己的算法用于评分。

由于 SQuAD 所能提供的庞大的数据规模,这个测试被认为是当前世界监测机器阅读水平的最权威测试之一,能够检测出机器学习模型能否在处理大量信息后给出问题的准确答案。

来自阿里巴巴 iDST 团队的 SLQA+ 模型最终取得了 82.440 的成绩,超越了人类的 82.304 分;而晚一天参与挑战的微软亚洲研究院自然语言计算组的 R-NET+ 模型,也在 EM 值(即 Exact Match)上取得了 82.650 的最高分。

从整个榜单来看,来自中国研究团队的表现十分突出。除了阿里和微软之外,腾讯、科大讯飞等团队的测试结果也都名列前茅。

阿里巴巴研究院自然语言处理首席科学家司罗指出,在类似 “天为什么会下雨” 这种客观性问题方面,人工智能的回答准确率较高;而通过建立一种 “基于分层融合注意力机制” 的深度神经网络模型,机器还可以模拟人类在阅读理解文本时的一些思考、标注、通篇理解等行为。

目前,阿里巴巴已经把这项技术应用在了旗下的很多产品之中。比如作为智能客服的阿里小蜜,就采用了这种机器学习阅读理解技术。当顾客对某个商品提出一些基础性的问题时,机器可以直接对商品详情页面中的信息进行阅读和归纳,来解答用户的提问,提高服务效率。

在双 11、双 12 等流量较大的购物节活动中,这样的自助服务非常有效果。把这些基础性的问题交由智能客服去解决,复杂问题再留给人工客服,可以达到事半功倍的效果。

除了电商零售行业之外,机器语言理解技术还可以用于博物馆指南、在线医疗问题解答等领域中。

这一趋势同样体现在微软的人工智能应用中。在人工智能的用户终端体验方面,微软最出名的就是旗下的两个人工智能助手小娜(Cortana)和小冰了。尤其是中国血统更加浓厚的小冰,在提供聊天机器人商业解决方案上面应用范围颇广。

京东小冰、东航小冰、敦煌小冰……当你打开嵌入了微软小冰的智能客服系统时,经过研究员对基于文本、语音、语义识别的几次技术迭代,如今的小冰已经变得越来越 “善解人意”,回答也越来越接近于人类的自然语言。

人工智能的学习能力的确强大到令人类感受到威胁,但如果替它们找到合适的应用场景,这种 “机器胜过人类” 的案例反而不是什么坏事。

题图来自:Blogger

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中