BAT 早已入场人工智能,阿里巴巴先做出了消费级产品?

公司

2017-07-04 17:22

在过去的十几年的时间里,国内互联网早已形成了 BAT 格局,百度把持了国内互联网的搜索入口,电商版图大半归在阿里巴巴旗下,而社交则很难绕开腾讯。

不过随着各自商业模式的不断扩张,BAT 之间的小规模交战也不断发生,互有攻守之下阿里和腾讯已经甩下百度,竞相角逐亚洲市值第一的宝座。而百度又想着依仗人工智能,完成接下来的追赶任务。BAT 当中百度在人工智能上起手最早,不过阿里巴巴和腾讯并非对人工智能的趋势熟视无睹,都已经纷纷开始招揽人才,建立团队,发布产品了。

经历了移动互联网的爆发,智能硬件的虚火之后,人工智能如今是业内最为火热的词汇,这场轰轰烈烈的人工智能百团大战中,有投机的,有盲目参战的,也有正儿八经想抢滩登陆的。

作为一个非常宽泛的概念,人工智能的指代范围非常之广,不管是像福特这样的车厂还是 Google 这样的互联网厂商都在搞的自动驾驶算是人工智能,我们调戏的 Siri 和 Cortana 这些语音助手也是人工智能,战胜了中日韩几乎所有围棋高手的 AlphaGo 更是不折不扣的人工智能。更不用说涉及到复杂概念的机器学习,蒙特卡洛算法之类的名词。

(从左至右分别为阿里巴巴 iDST 副院长任小枫、院长金榕、副院长华先胜)

另一个难以回避的话题是,人工智能专家目前极其紧缺,人才争夺战早已经打响:吴恩达加入百度又离开,张潼从百度研究院副院长任上离开来到腾讯担任 AI Lab 的主任,最近阿里巴巴从美国西雅图挖来了亚马逊级别最高的华人科学家任小枫, 担任阿里巴巴 iDST 首席科学家和副院长……

可是,这些人工智能背后的玄妙算法和高端人才和普通消费者又有什么关系呢?

风起于青萍之末, 浪成于微澜之间。人工智能听起来是千里之外,但并非都是 AlphaGo 和柯洁之间的神仙大战,支付宝里面的刷脸登录,用亚马逊 Echo 智能音箱语音操控开灯关灯,哪怕是用 Siri 点一首歌,都可以说是人工智能的应用。看似简单的行为,其实都用到了图像识别和自然语义理解。

(柯洁对阵 AlphaGo)

如果不考虑人工智能热潮下的宏大背景以及业已存在的一定泡沫,只聚焦到两件事的话,一个就是 AlphaGo 在这一年时间里的连战连捷,让普通大众知道了人工智能的飞速发展,对人类能力的盲目乐观和对人工智能的盲目恐惧,其实就只隔着几局对弈的时间而已。在这个实验性和公关性都诚意满满的 AlphaGo 之外,人工智能产品的落地最让人瞩目的是亚马逊的 Echo 智能音箱系列产品。

(亚马逊 Echo 音箱)

有研究机构表明,亚马逊 Echo 去年全年售出 630 万,预计到 2020 年,亚马逊将总共售出 6000 万台 Echo 设备。该机构预计 Google Home 的销量将在今年年中触及 100 万台。见惯了智能手机厂商动辄千万或者上亿的出货量,几百万的音箱卖出去似乎是小数字,不过相对于刚刚起步的消费级人工智能产品来说,这个数字不算令人沮丧。算起来,初代 iPhone 的年销量是 600 万。

普华永道日前发布一份有关定义人工智能 AI 价值的报告(《What’s the real value of AI for your business and how can you capitalise?》)显示,预计中国和北美有望成为人工智能最大受益者,总获益相当于 10.7 万亿美元,占据全球增长比例的近 70%。

Frontier Economics 与埃森哲联合发布的报告则称,教育、住宿和餐饮服务、建设、批发和零售、医疗、农业、社会服务、交通、制造以及金融服务等行业从人工智能中受益最大。

(吴恩达曾带着百度大脑上节目)

在类似于 AlphaGo 这样的实验性和公关性项目上,百度和阿里都有相关的项目放出,比如在《最强大脑》大放光芒的 “水哥” 王昱珩就先后和阿里系的人工智能 “蚂可” 以及百度的 “百度大脑” 对决过,阿里云小 Ai 也登上《我是歌手》的舞台预测冠军归属。

虽然大企业有马太效应,不过在重新上路的人工智能技术上,大家的起跑线其实差得并不是很远,看起来有人预判对了先跑一年,但是从这场看起来会是旷日持久的马拉松竞赛来看,大家都只是刚刚起步而已。

上面所说的人工智能技术人才紧缺,其实也是人工智能看起来是爆发之势但其实才起步的表现之一。这是一场速度和耐力的双重比拼。

对于阿里来说,过去在电商等领域的辉煌,和人工智能的从零到一其实关系并不大。阿里人工智能实验室一样需要认真做研究,发论文,申请专利。

就在前几天,阿里巴巴的一篇关于自然语言处理的论文《一种新的语义编码模型及其在智能问答及分类中的应用》被 2017 国际知识发现与数据挖掘大会收录。

阿里巴巴这套 “即刻唤醒,即刻识别” 神经网络模型的智能问答准确率相比微软的 wikiqa 数据集和 IBM 的 insuranceqa 数据集提升了 2%-4%,是目前业内最高水准。

根据机器之心的报道,基于神经网络的自然语言理解方法非常依赖于分词,而在英文中,分词是天然的,中文却是以 “字” 为单位。

这篇论文的作者,阿里巴巴人工智能实验室资深算法工程师王成龙对机器之心说:

英文的句子结构则更加清晰,而汉语重意合而不重形式,句子结构比较松散,中文相关标准语料集的缺失也是一大瓶颈。

所以他们在初期训练相关模型的时候,中文语料是缺乏的,必须要伴随着开发积累一批独有且海量的中文语料来支持模型训练。

这篇论文的出炉意味着,阿里人工智能实验室的研究,不是说站在巨人肩膀上,也不是有大量现成的国外经验可以复制,一切都是从零开始。

一方面,阿里要在人工智能往上做学术研究,发论文申请专利,另一方面,阿里也需要人工智能的往下落地,成为产品和服务。

在人工智能的产品落地上,阿里系明显想要后发先至,定损宝能够取代保险行业中定损员的核心工作任务,最近来自阿里人工智能实验室的发布会邀请函也频频露脸,从「会说话」这个特征以及「未来,开口即来」的主题来看,阿里巴巴这次很可能会发布一款与智能语音相关的消费级产品。

人工智能是技术手段,在此基础上可以构建不同的商业模式。

至于阿里想要在人工智能里面交出怎样的消费级产品,树立怎样的品牌,最后祭出怎样的标准和平台来合纵连横占得先机,就等 7 月 5 日下午阿里的发布会了。届时爱范儿也会在现场进行微博全程直播。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中

在命运的塑料大棚里,每棵被喷了过多农药的白菜心中,都曾经有一个成为无公害有机蔬菜的梦想。

本篇来自栏目

解锁订阅模式,获得更多专属优质内容