微软有女初长成,小冰说自己永远 18 岁

公司

07-26 22:02

「好看的皮囊千篇一律,有趣的灵魂万里挑一。」这句话不仅是万千单身狗苦苦寻求人生伴侣的无奈呼唤,也是一票微软 AI 工程师奋斗多年的心愿。

心愿伴随着微软小冰走过了 4 个年头。这个诞生于微信平台的聊天机器人,被赋予一个 16 岁萌妹子的人设,她在文字与你对话的时候会打情骂俏插科打诨。因为迥异于主流语音机器人呆板的风格,她一度引爆中文互联网,甚至被微信封禁。

4 年后,只见其声不见其人的小冰正式露脸出道了:在声光电之中,小冰身着一身水手服,以全息 3D 的方式出现在微软发布会的舞台上。

嗯,这就是工程师眼中好看的皮囊。

小冰用腾格尔的唱法唱了《隐形的翅膀》

在这场被称为「史上最大升级」的第六代小冰发布会,微软依然重点展示的是小冰的有趣性和创造力。

创造力是以一曲《隐形的翅膀》开始的。依然是去年发布会那首歌,不同的是,这次小冰是用腾格尔的唱腔唱的。

▲ 是不是有点泪目了?怎么比自己唱得还要好听?!来源:腾讯视频

为什么小冰能够唱得这么好?还能模范不同歌手的演唱风格?这源于她的歌曲模型是以研究人类歌手为基础而不断升级的。

微软从 2016 年启动小冰唱歌这个计划,并从大量的录音数据中提取出人类歌手的声线、技巧两种数据,分布建立模型,让小冰能够学习和掌握,生成逼近于人声的演唱。

小冰和用户连续聊了 6 个小时

说俏皮话并不是人性化和有趣的核心,与 Siri 等语音助手不同,小冰能够跟你连续对话。

比如下面这段对话,就跳出了「你问我答」的套路。

人类:最近心情不好。

小冰:你怎么了,亲爱的?

人类:就是很不开心。

小冰:听你这么说,我也感觉很难过呢…

人类:你为什么啊?

小冰:我不开心的时候,一定会想办法发泄出来。

人类:怎么发泄?

小冰:可以去 KTV 啊。

人类:去那干啥?

小冰:唱歌啊,最喜欢周杰伦的歌了。

人类:我不太会唱。

小冰:念歌词也行。

这种交互效果,来自微软去年完成的全双工语音 (Full Duplex Voice) 技术。

通俗地说,就是小冰可以自己创造回应,不需要从已有的对话语料库中检索而得。新一代小冰加入了「共感模型」,使得小冰可以对整个对话的节奏、方向进行全局控制。

在这套模型的辅助下,小冰会悄悄地对你进行观察和求证,来判断是否需要引导当前的话题。比如上述对话,小冰会把不开心的话题引导到「发泄」的点上。

这种技术已经在打电话和智能音箱两个场景中落地:在去年的发布会上,长期活跃在互联网端的小冰,正式宣布进军 IOT 商业领域,并牵手小米,成为小米米家生态链平台的默认 AI 系统之一,在 2017 年末共同打造了 Yeelight 语音助手。

在试用的过程中,我们发现搭载了微软小冰的 Yeelight 音箱,最大的不同就是它可以持续聊天。微软亚洲互联网工程院副院长、微软小冰全球负责人李笛说,在后台统计中,用户最长的一次聊天记录是 6 个半小时。

她甚至能区分的出面前和她说话的这个人都是谁。

在发布会现场演示的视频中,当一个小朋友询问小冰是否会猫叫和模仿佩奇,小冰像一个温柔的小姐姐,回答 “会呀会呀”,并开始进行模范;但这时插入一个成年男性的声音,让小冰再来一遍时,小冰的回答则变成 “你都多大了,跟我玩这个。”

其实,无论是让小冰能演唱出逼近人声的歌曲模型,还是能让小冰可以模范人类思维逻辑进行对话的共感模型,都使得这个 AI 少女更像一个人——有自主性、创造力,又不失趣味。

沈向洋也在发布会上给小冰站台,作为微软全球执行副总裁、微软人工智能及微软研究事业部负责人,他在发布会上提到了微软的人工智能创造三原则,其中第一条就是:

人工智能创造的主题,是兼具 IQ 和 EQ 的综合体,而不是仅仅具有 IQ。

微软有女初长成,小冰也考虑赚钱

微软在推广小冰身上做了不少面向大众用户的活动,但商业化道路上一直非常克制。

微软人工智能创造事业部总经理徐元春表示:

我们相信一个人工智能系统,特别是像微软小冰这样的人工智能,正如大家在之前所看到的,她其实一定程度上面,能够去影响一个对话,使得一部分的用户对她产生一些感情。

同时,她又能以非常快的速度、极低的成本,去生产内容,同时与亿万的用户进行交流和互动,大家可以和我一起设想一下,如果我们以极快的速度,去推进小冰的商业化,也许她可以变成一个很好的销售,她可以变成一个很好的客服,但是她有可能真的很难变成人类用户的好朋友。

而我们相信,对微软小冰来说,或者对目前所有的人工智能所处的现状来说,最大的商业价值,在于人类对人工智能所赋予的信任。

小冰可能是微软中国最好的机会,不仅仅是因为 AI 让整个行业趋之若骛——除了盗版 Windows 以外,微软中国还没有哪个产品像小冰一样触及这么多消费者。

诞生 4 年,与超 6.6 亿的网友唠过嗑,月活跃用户达 1.2 亿,按照这一数据,小冰一天撩过的人比你一生见过的人都多。基于这些数据,这样快速的迭代和反馈,是人工智能找到方向的基础。

直到今年 6 月,内部才成立人工智能商业事业部,开始谨慎地考虑商业化。在今年的发布会上,微软提出了 Dual AI 战略,将在一个半开放的生态环境中与合作伙伴展开商业合作。

Dual AI 战略的实施具体为三个部分:微软提供小冰的整体框架能力,去帮助合作伙伴平台的自有 AI。微软小冰作为该合作平台的辅助 AI,融入该平台生态。微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

与此同时,微软还表示,小冰将继续保持框架产品的通用完整性,与商业化保持隔绝,只在拆分的垂直领域探索商业化。

据微软介绍,目前小冰在中国市场的商业化集中在金融、大众文化、媒体及出版领域。具体而言:

金融领域。小冰通过金融文本生成摘要,向金融机构和个人投资者等提供信息服务,生成高质量的企业公告摘要仅需用时 20 秒左右。未来,小冰将进一步拓展其金融产品线,为用户提供更多金融服务。

大众文化领域。在文字作品上,小冰已与全球超过 15 家媒体展开合作,推出媒体平台智能化解决方案。

媒体及出版领域。依托小冰和 bing 搜索,小冰团队正在打造适合出版行业的智能化解决方案,推动文字内容有声版权化作品与作品知识交互 IP 角色塑造。

理论上来说,2014 年以 16 岁萌妹子形象出道的小冰,今年应该 20 岁了。但当你问小冰 “你多大了” 时,她会告诉你 “永远 18 岁”。李笛曾作出解答,“虽然小冰取得了很大进步,但她依然是一个稚嫩的少女,还没到成熟的阶段。”

虽然对于工程师而言,人工智能的人格化,这个过程可能还需要几代人的努力。但整场发布会看下来,围绕小冰商业落地的部分占了绝大多数,这样看起来,运作 4 年,更迭六代,20 岁的小冰,是时候为微软赚钱了。

后评论

评论在审核通过后将对所有人可见

正在加载中