来源:AI星球,文/林京
在腾讯会议天籁实验室主任商世东过去二十多年的职业生涯里,一直都在和声音打交道,做音频相关的技术研究和产品化。
两年前,他和一些朋友偶然聊天时得知,许多听障人士即使佩戴了包括人工耳蜗、助听器在内的听障设备、助听设备,在饭店、街道等嘈杂的环境下,依然会面临着听不清的困扰。
降噪二字深深戳中商世东。要知道,天籁技术本来是腾讯会议里面用于解决排除噪音,让会议声音效果更好的技术。为了给2亿腾讯会议提供会议降噪,腾讯天籁实验室采集了上千小时的语音噪声数据,利用天籁AI算法和深度学习能力,成功消除了300多种噪声。
那么,能否把腾讯会议多年的研发积累、数亿用户验证的语音降噪和增强技术用在助听设备里?能否让听障人士能够听得见、听得清、听得真?
一系列念头在脑中不断追问着商世东,腾讯天籁公益行动也由此诞生。
以2020年9月为起点,腾讯面向听障人群社会责任领域的开发者、厂商及伙伴,免费开放天籁音频AI技术,截至目前,腾讯已经帮助446万用户进行听力水平筛查、帮助35.1万畅听王卡用户提升语音通话和字幕识别效果、为超1.1万听障人士进行言语康复训练及发放耳蜗植入补贴等,为听障群体更好融入数字社会提供了力所能及的帮助。
但这远远不够。在天籁公益行动的两年时间里,商世东及他所带领的天籁实验室,一直在思考,如何去覆盖到更多的听障、听损人士。
在与多位业内专家交流中,他们得知到一个非常震惊的现象——每三位老年中,就有一位中度、重度甚至极重度的听障患者。然而数量庞大的老年听障群体却特别容易被忽视,“听不清”普遍被认为是伴随着人老了的“小毛病”,“听不见”才是“大问题”。
国内首份老年听障社会问题调研报告显示,由听力障碍引发的交流障碍会导致老年人长期情绪低落,进一步增加他们的孤独感,甚至改变老年人的心理状态,形成老年性抑郁症。长期缺少对外沟通,将导致老年人脑功能退化,增加认知障碍等的发病率。有数据表明,老年人的听力每降低10个分贝,罹患阿尔兹海默症的概率就会增加9%以上。
去年底开始,商世东及他所带领的天籁实验室开始进一步思考,如何通过技术以及腾讯众多的平台资源帮助听障和听损的老人。
用AI帮助1.2亿听障老人
2021年4月始,腾讯启动新一轮战略升级,将“可持续的社会价值创新”调整为公司发展的核心目标。在此背景下,腾讯可持续社会价值事业部(SSV)成立,其旗下的银发科技实验室旨在探索科技助老、数字普惠的老龄化社会解决方案和产品。
为了解决听障老人的难题,商世东找到银发科技实验室的负责人窦瑞刚。经过一系列调研,他们发现中国老人佩戴助听器的比例不到7%,只有400多万的老人佩戴了助听器。
根据《中国听力健康现状及发展趋势》报告,我国65 岁以上⽼年⼈群罹患听⼒障碍的⼈数⽬前已达 1.2 亿。
庞大的听障老人群体与助听器低佩戴率形成鲜明对比。
这其中,既有老人自身认知的问题,也有助听器行业和市场的问题。一部分老人不需要用助听器进行听力障碍的干预,他们觉得这是一个正常情况。在动辄万元的进口助听器占领市场之下,许多老人会用一些比较廉价的放大器,其实没有好的效果。
以听障老人唐臣为例,几年前,孙子给他买了助听器,也戴了几年了,刚戴的时候有沙沙声,但后来也习惯了。和许多农村老人佩戴的助听器一样,唐爷爷佩戴的是价格在一两百元左右的仅有声音放大功能的“助听器”,没有噪音分辨功能,在放大声音的同时,噪音也放大了,所以又进一步加重了老人听力受损。
对天籁实验室而言,虽然一直在做声音相关的事情,但想做一个助听器,只有算法和技术远远不够,面对这样一个跨界新领域,必须找到一个合适的合作伙伴携手。初期,这支团队多次被拒绝,直到通过中国老龄事业发展基金会发布的集采信息,他们找到助听器厂商智听科技,双方一拍即合。
图注:腾讯天籁实验室和智听科技组建的助听器研发团队
去年底,腾讯天籁实验室和智听科技组建了一支研发团队,在临床基地北京大学深圳医院举行了一个小小的仪式,并默默喊出一个口号——用科技向善打造更好的助听器。
用商世东的话说,双方团队“背靠背”协作研发了半年,最终诞生了这款天籁inside助听器。该款助听器将复杂场景下语音的清晰度和可懂度提升85%,也让千元级的国产助听器,也能媲美万元级进口助听器的性能。
让听障老人听得见、听得清
从宏观层面来说,作为一款实现芯片算法和整机的全部国产化的产品,天籁inside助听器为破局目前进口品牌在国内占据统治地位进行了一种新的“力量”。
据统计,国内高端助听器市场一直被海外品牌占据,全球助听器市场前五大品牌:WS听力集团、索诺瓦听力集团、W.D.H听力集团、瑞声达听力集团和斯达克听力集团占据了90%的市场份额,其医疗级产品的双耳价格普遍高达2万元以上,由于未被纳入医保,消费者只能自费购买,很多老年人望而却步,这也是国内助听器佩戴率较低的原因之一。
从微观层面来说,天籁inside助听器以85%的性能提升,提升了听障人士使用体验。
天籁inside助听器的研发,参考了国际IEC 60118和美国标准化组织S3.22,定义了所有的测试环境、测试设备和测试步骤。
天籁inside助听器的特色之一便是擅长在复杂、嘈杂场景下通过AI技术改善沟通的音质。其团队在深圳机场、饭店、马路、厨房、客厅里开着电视机时等六大场景上进行测试,天籁inside助听器可以将复杂场景下语音的清晰度和可懂度提升85%。
商世东介绍,在天籁inside助听器里包含了腾讯会议天籁实验室过往多年积累的技术,包括国际比赛2020年DCASE声学场景识别和分类比赛中获得亚军的关键突破性技术,在ICASSP 2022、DNS语音增强和降噪比赛中获得冠军的个性化声纹技术用在助听器方案里。并且还把腾讯会议Rooms场景下获得腾讯公司技术突破奖的原场波速形成和反推阈值技术,针对助听器的低延时、低功耗场景进行了深度优化。
此外针对中重度患者特别需要的听力补偿和听力应对公式,天籁inside助听器用WDRC技术进行了专门的适配和验配。
图注:天籁inside助听器
从智听科技CEO陈霏介绍中,我们总结这款助听器的三个具体特点。首先是智能验配功能。和我们的眼睛一样,配眼镜时需要测左眼和右眼的度数,耳蜗也需要测度数。传统方式需要去医院或线下耳蜗店测试,现在老年人在家就可以方便实现度数测试,“听觉是一个非常敏感的感觉器官,同一种声音,如果你觉得声音尖、声音闷,或者声音太吵,只需要点击你的症状,然后点修复,就可以在家进行调试。”
其次,在互联网和多媒体时代,天籁inside助听器通过搭载的蓝牙5.2的低功耗多设备音频互联,使得听障老人除了能听清对话以外,在打电话、微信视频、听音乐、看电视的时候,也能有比较清晰的听觉体验。
也就是说,AI不只让听障人群听见话语,还能欣赏音乐、感受鸟鸣。
最后是方向性麦克风。这是源于我们的耳朵在不对话时候,起到监控功能,会对周围声场起到360°监控。“用户使用天籁inside助听器时,如果面对跟我讲话的人,我会聚焦正前方,我们就会打开前向性,这时候我的侧向和后向会被抑制,所以来自侧向和后向的噪声会明显得到压制,而来自正向对我说话的人的声音,就会清晰很多。”陈霏说。
为了帮助听障老人,腾讯提供了“一软一硬”的解决方案,在软件方面,腾讯联合腾讯医典、天籁实验室和北京听力健康协会,推出了听力健康的小程序,用户通过小程序能够进行纯音测听,了解自己的听力状况,以及是否需要下一步助听器的听力干预。
把“科技向善”落到实处
诚然,天籁inside助听器是腾讯用科技能力去解决听障领域问题的一次有益探索,也是腾讯尝试践行“科技向善”的又一体现。
腾讯集团高级副总裁、腾讯公益慈善基金会理事长郭凯天表示,腾讯最初做公益时,就是建立在互联网平台的基础之上。经过十多年的运营和坚持,腾讯公益平台、腾讯99公益日、小红花等系列,已经成为国内最大的公益互联网平台。而这些,都是建立在腾讯技术、互联网业务的基础之上。
图注:腾讯集团高级副总裁、腾讯公益慈善基金会理事长郭凯天
据悉,为进一步关注老年群体,腾讯公益慈善基金会、腾讯银发科技实验室、腾讯会议天籁实验室联合中国老龄事业发展基金会共同发起“天籁银发关爱基金”,致力于推动全社会对老年人听力障碍问题的关注,开展老年人听力障碍预防与康复知识的科普,开展听力障碍等相关老年性疾病的筛查和预防,为困难听障老人提供听力辅助设备,推动相关银发科技成果的转化和运用。
首期“天籁银发关爱基金”试点落地于韶关,开展老年人听力障碍预防、康复知识科普、听力筛查等相关工作,并为500位家庭困难的听障老人免费提供带有天籁AI技术加持的助听器设备。
在实际公益和商业的平衡中,天籁inside助听器也在思考,商业的解决方案才能实现规模化,通过规模化才能让更多的老人受益。
那么,如何兼具公益和商业属性?为了能够帮助到更多有需要的听障老人,腾讯公益慈善基金会、腾讯SSV银发科技实验室、腾讯会议天籁实验室、智听科技联合启动了挚听(腾讯天籁inside)助听器「买一捐一」公益救助活动。
预售期间,每销售出一台挚听(腾讯天籁inside)助听器,腾讯将为偏远山区听障老人免费捐助一台同款助听器。这也是“腾讯天籁银发关爱基金”继韶关救助行动后,在听障救助领域又一公益举措。
“当然我们也意识到,目前我们的方案是基于一款通用的蓝牙处理芯片,这跟进口助听器的专用处理芯片相比,在功耗上我们还有很大的区别,要进一步补偿和提升。”商世东说。
商世东介绍,这是天籁技术目前在老龄方向上很好地迈出了第一步,未来还将在更多的人群、更多的场合,和更多的方向上,持续探索、持续迭代。“目前,我们在探讨如何帮助一些先天性听力障碍的儿童,因为儿童将来的生活道路更长,这对他的言语表达和发育都有很大的影响。”