927 国际聋人日,科技互联网公司怎样让人「听清」

产品

09-28 17:49

听是我们与这个世界建立起最早的联系。人类获取的信息虽然有 83% 来自视觉,但听觉却是人类最早开始发育的知觉。听觉不如视觉般能带来直接的感官刺激,却能更快速抢占你的注意力。

如果你是一个经常在社交平台「冲浪」的人,那你很可能看过类似视频:出生即失聪的婴孩在母亲的怀里,经由医生的帮助戴上助听器或打开了人工耳蜗的开关,小朋友寂静的世界第一次听到了声音。他们慌乱、大哭,但最终会看着自己的母亲露出一个真心的笑容。

这就是听障人群的世界,没有声音,令人畏惧,但同时也充满希望。但这些听障人士听到的是怎样的声音呢?

被忽视的「声音」

我们曾在《去了 N 次盲人按摩后,我看到了他们的 3 倍速互联网生活》一文中介绍过盲人的互联网生活,三倍速的语音播放读屏工具成为了生活的基础,声音成为了他们的眼睛,代替他们「看」到更大的世界。

和盲人比起来,听障人群的世界可能没有那么悲伤,因为他们其中大部分人还有助听器或人工耳蜗的选择。这两种技术可以让失去听力的人重新听见,即便是不像普通人那样听得清晰,至少他们也能听到声音。

但听障人士的数量也远比你想的要多。

▲ 图片来自:The New York Times

据世界卫生组织数据显示,全球约有 11 亿的 12-35 岁的年轻人面临听力损失的风险,约有 3.6 亿人患有听力损失的障碍。据第二次全国残疾人抽样调查结果显示,中国有听力障碍的人群是 2780 万,为国内五大类的残疾人群中之首,而且每年还以两到三万的新增儿童在继续增长。

人工耳蜗和助听器是他们的「义肢」,只是这个「义肢」没有那么显眼,不像拐杖或轮椅,能让你第一时间意识到对方是需要帮助的人。同时,这也让他们更不容易被理解,更需要帮助。

为了更好地造福于世界聋人,捍卫聋人的权利,帮助聋人康复,世界聋人联合将 9 月第四周的星期日设为了国际聋人日。

而今年的国际聋人日就是 9 月 27 日,在这一天,腾讯多媒体实验室联合腾讯公益慈善基金会、深圳市信息无障碍研究会等机构召开发布会,宣布发起「天籁行动」,通过面向公益开发者、设备厂商、NGO 及行业免费开放腾讯天籁 AI 音频技术,帮助听障人群解决「听不清」难题。

外溢的大公司技术

提醒解决「听不清」难题的办法当然不是自己做人工耳蜗,而是一个在商业上更准确的词——技术赋能。腾讯把自己的音频处理技术和相关的厂商分享,帮助他们能够在人工耳蜗上用上更先进的专业技术。

在疫情期间,如果你用过腾讯会议的话,你或许可以更好地理解这种实时音频技术。在腾讯会议中,只要你在设置中打开了音频降噪的开关的话,你就会发现自己的声音可以更准确的传达给对方,噪音则是被这个技术「过滤」了。

▲ 腾讯会议 app 中的音频降噪

这种过滤的技术也用在了人工耳蜗里,听障人士能够借助其中人工智能的力量听得更清晰。

关于听障人士戴上人工耳蜗后听到的声音,浙江诺尔康神经电子科技(旗下有晨星人工耳蜗系统产品)有限公司的总经理李楚向爱范儿介绍了它的具体工作情况。

正常人人的耳朵里有 15000 万个左右的听毛细胞,听毛细胞是连着听神经的。正常人耳朵的声音传到中耳,中耳把声音信号变成一个振动信号。振动信号到了内耳,把里面的淋巴液浮动起来,听毛细胞随着这种波动会产生生物电到了听觉神经。然后听觉神经受到刺激传到大脑就听到声音了,这是正常的声音渠道。

耳聋患者,听毛细胞死光了,所以就缺少途径把振动信号变成电信号传到大脑。我们现在所做的就是拿一根电极植入到耳朵内部。目前全球最多的电极是 24 个,耳蜗是蜗牛的形状,上面是低频,下面是高频,平摊出来就是一个钢琴键盘,正常人有 15000 个键盘,我们(听障人士)有 24 个,所以我们(听障人士)听到的声音和正常耳朵听到的声音是很大的区别。

我们认为这是可以通过技术改善的,让他们听得更多。

如何理解听障人群「听到的世界」呢?你可以想想一个雾气朦胧的澡堂或者一个没有循环系统的室内烧烤,一切都是烟雾缭绕的,你看不清,不确定。这种像隔着一层布被阻隔、无法确定的声音就是听障人群听到的「世界」。

在这个环节中,让听障人士听得清、听得真虽然不是一个从 0 到 1 的创举,但对听障人士来说也意味着从 0.5 到 0.8。

遗憾的是,即便腾讯多媒体实验室想要将自己最先进的算法放进人工耳蜗里,人工耳蜗有限的运算资源也无法承载一个机器学习的模型。

在这种情况下,研究人员用上了手机。用手机的运算资源承载模型,采集并增强语音,提升 40% 的语音清晰度和可达度,最后再让它被听障人群「听」到。

而在被问到人工耳蜗中技术的商业化计划时,腾讯表示:

我们整个项目的起点始终是我们用打造产品的外溢技术做公益,没有相关的商业打算。

科技向善,技术发声

自从马化腾、刘炽平及全体总办成员在腾讯成立 21 周年时「用户为本,科技向善」之后,腾讯在公益上的动作越来越多。

之前,腾讯优图实验室利用深度学习技术,突破「跨年龄人脸识别」,助力警方寻回被拐十年儿童。让 AI 看到 8 岁被拐的孩子在 18 岁可能长什么样,以此技术帮助家人寻亲。

QQ 空间则是启动了「无障碍 AI 技术」的开放项目,让更多的企业和开发者可以使用 OCR 文字识别、语音合成、图片转语音等无障碍 AI 技术,制作更多有利于用户的产品,让视障人士、听障人士也能使用。

面对科技和公益,腾讯公司高级执行副总裁汤道生说

科技延伸人的能力,同样也可以弥补我们身体的缺陷,打破「障碍」,让每个人能平等地探索生活和世界。这也成为包括腾讯在内,许多科技企业、社会机构关注的方向。

特殊人群的需求多种多样,无障碍领域的科技创新,被越来越多行业和企业重视。腾讯希望充分发挥技术研发优势,开放自身的能力,为信息无障碍社会的发展贡献力量。

▲ 图片来自:The New York Times

在加利福尼亚州的北部,全球各地的聪明人聚在一起,思考怎样才能让人在搜索引擎中搜出自己最需要的信息,怎样让人们更乐于和朋友分享喜欢的内容,怎样让无所不能的手机突破想象。在北京、上海、深圳、广州,有无数个实验室和创业团队正在探索将最新的科技成功延伸到 VR 眼镜、智能手表、刷手支付等一切的新应用中,探索人类的一种可能未来。

在不少聪明人在向前冲的时候,也有人选择停下来,把最新的技术用在了那些容易被忽略的领域。失踪多年的儿童搜寻,人工耳蜗的声音识别,他们不像游戏、应用那样有更广泛的受众,但他们的的确确被人所需要。

▲ 爱范儿曾经采访的盲人互联网用户正在使用 app 读屏

深圳市信息无障碍产品联盟发起人梁振宇就表示,科技的存在不仅在于助残和帮助弱势群体。

整个中国必然的趋势就是用最新的技术解决千百年来没有解决的社会问题。我觉得腾讯提出科技向善的愿景开始引领了一个趋势,立了一个很高的标杆,科技公司有科技实力就愈加用你的科技实力帮助弱势群体。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中