【猎云网(微信:ilieyun)上海】11月22日报道(文/孙媛)
你是否羡慕钢铁侠拥有Javis,一个具有独立思考能力的智能AI,能管理和应付主人的一切问题。如果有这样的智能助手,让你的爱车秒变Javis,你是否会怦然心动呢?
在2021广州车展上,斑马智行基于AliOS打造的最新智能座舱系统——洛神智能座舱系统实现量产落地,并率先搭载于即将上市的全新荣威RX5 MAX与名爵MG ONE。在该系统中,斑马智行语音在技术与产品层面再一次全面融合创新,即将为每个车主打造属于他们的Javis。
作为业内首个将语音定义为车内第一交互方式的头部玩家,斑马智行在语音交互上不断打怪升级,跳出原有桎梏,从指令式交互,到自然对话交互,再到自然对话2.0的升级,一直引领行业发展。而这一次,洛神智能座舱系统的出现更是意味着斑马智行率先进入了智能语音助手时代。
车载语音作为智能汽车核心交互方式拥有巨大潜力,斑马智行不仅在产品体验上,更是从产业层面,积极推动传统车载语音行业以及主机厂商的创新变革。这一次,斑马智行智能语音助手的出现,又将在车载语音掀起怎样的革新浪潮呢?带着一系列问题,猎云网独家采访了斑马智行语音产品负责人吴晓敏。
越来越智能的车载语音,成为主流交互方式
众所周知,语音交互功能,已经成为智能网联汽车的“标配”,一直是车联网公司和主机厂发力的重点领域。
“互联网女皇”玛丽·米克尔在其每年发布的《互联网趋势报告》中,多次强调:语音是最有效的计算输入形式,将成为人机交互的新范式。语音即计算界面,其应用的三大场景是家里、车里、随手,更快更方便就是用户价值所在。
而被视作“第三空间”的汽车场景,通过自然对话完成人车之间的主动交互,正在成为现实。
直至今日,车载语音交互市场正在呈现出多元化的发展趋势,本地+云端、自然语言理解、多元化内容及服务生态都在持续快速升级。
高工智能汽车研究院监测数据显示,2020年国内新车(合资+自主品牌)前装搭载语音识别及交互功能上险量为1206.4万辆,同比增长17.88%。车载语音已成为汽车继中控屏外的第二交互手段。
在前装搭载率方面,去年语音识别及交互功能前装标配搭载率从2019年的49.82%提升至63.25%。而今年1-6月,这个数字继续提升至68.01%。据公开数据统计,2020年中国前装车载语音市场(包含软硬件)规模约为17亿元人民币,到2025年,市场规模将增长至30亿元人民币。
随着我国自主汽车操作系统在智能汽车时代的“翻盘”,以低价标准化产品占据车载语音市场高份额的讯飞、Cerence开始面临挑战。不止BAT、华为等实力企业,造车新势力也开始对这个市场“虎视眈眈”。
手机语音助手、智能音箱的出现让大家对车载语音交互的智能要求更上一层,而将这样的能力应用到车内场景绝非易事,面临着声学、自然语言处理、数字信号处理等多个复杂学科,以及网络问题的挑战。
据《2021麦肯锡汽车消费者洞察》显示,80%消费者重视智能汽车技术,超过半数愿意为智能功能买单。这意味着在智能汽车时代,得“智能”者得天下,而其背后则是AI与算法的深度较量。
研发无设限,斑马智行引领车载语音创新变革
历经十年发展,斑马智行自研AliOS,经过市场检验,在技术、体验、效率方面实现“三大领先”。依托AliOS,斑马智行以“智能车机-智能座舱-智能汽车”为战略着力点,确立了从智能车载操作系统向智能座舱操作系统、整车智能操作系统演进的“OS三部曲”战略。
而交互智能作为斑马智行聚焦用户体验的三大方向之一,更是可以用“投入无上限”来形容。
事实上,在2016年之前,市面上所谓的语音交互都处于指令式交互的初始阶段。汽车只懂产品经理写的指令,所有的交互逻辑固化。用户与汽车对话,需要遵循着一定的指令,不能在超出范围之外发挥。
困于技术的限制,大量的车没有配备语音交互的功能,即使配置了,用户也不会去使用。车载语音市场被科大讯飞、Cerence两大语音技术厂商瓜分大量份额,主机厂商把车载语音作为卖车的手段,用小成本购买标准化产品,而无视用户体验。
数据显示,指令式交互系统的DAU基本上在10%以下,“不好用”、“鸡肋”、“傻”几乎成为车载语音的代名词。
2016年,斑马智行首次将自然对话技术引入到车内场景,给主机厂商和用户带来了全新的体验:原来还可以用“你好,斑马,我想看星星”这样的对话来让汽车自动打开天窗,更是开辟了行业的先河。荣威RX5语音开启关闭天窗、调节空调温度、播放音乐、开启导航、语音搜索、天气查询成为惊艳亮点。
在开放合作、系统打通的背景下,斑马智行在创新上事半功倍,于业内率先完成全场景全双工全闭环的自然对话2.0产品。
斑马智行语音产品负责人吴晓敏表示,与第一代自然对话系统不同,维纳斯(VENUS)智能系统全场景语音实现了车内绝大部分功能都能通过自然对话去触达;全双工更是打破用户与车的交互轮回,通过技术分解,在流式理解、语义拒识、语义打断等核心能力的加持下,能够实现用户与车更自然的对话;全闭环则是针对斑马智行的服务内容,用语音做到完全的闭环,在车内甚至可以用语音完成电影票、咖啡的购买、支付和送达。
如果说斑马的“语音开天窗”是打开了车载语音自然对话1.0时代的序幕,那么其在2020年推出的全场景、全双工、全闭环的维纳斯(VENUS)智能系统则是彻底吹响了车载语音交互方式变革的号角,语音的发展进入自然对话2.0时代。
在斑马智行的先行后,全双工、连续对话等技术,开始跑步进入车载市场。小鹏、理想、蔚来等新势力厂商也将其作为新一代语音产品的研发理念。
而这也意味着各路玩家在产品和技术之间的边界开始模糊,产品理念、用户体验逐渐趋同,市场在车载语音百花齐放的热潮下,呈现阶段性“内卷”的竞争态势,产品和技术的发展陷入了停滞。
达摩院人工智能引擎驱动,小跟斑定义车载语音助手新时代
在汽车智能化演进的过程中,语音逐渐成为车内的第一交互方式,语音交互体验的良好与否很大程度上决定了座舱整体交互感受,而搭载AliOS的智能座舱是斑马智行的核心基座,其能力高度决定了智能助手发展的上限。
吴晓敏坦言,头部厂商在自然对话交互上已不分伯仲,也都在陆续往智能助手的方向演进。然而厂商们所谓的智能助手却仍在自然对话交互2.0的阶段,浅层次的创新对行业发展推动作用微乎其微,俨然成为了一个“伪命题”。
对于斑马智行而言,融合创新一直是其车载语音升级的关键词。一方面,用户跟车、系统进行融合;另一方面,语音引擎跟其他模块融合。最后,设计出一个好的交互方式,来让用户觉得这是一个非常智能和友善的系统。
与传统车厂、新势力不同,斑马智行在车载语音方面一直有“先天优势”,那就是可以基于天猫精灵和达摩院的能力,作为阿里车业务的重要输出口,去进行车载场景的创新。
通过与天猫精灵的合作,斑马智行实现了车和家居场景的打通,可以在车内完成天猫精灵的设备控制,甚至也可以在家通过天猫精灵去查看车辆的状态。
二者相似场景和通用技能、数据的打通,让天猫精灵3亿级别的IoT设备互联能力、自然丰富的语音交互系统也可以通过斑马智行完成车业务的能力输出。
而在国际大赛上屡次上榜的阿里达摩院语音技术,更是让斑马智行插上了阿里集团强大AI能力的翅膀,通过共同打造涵盖声学硬件和结构设计、前端信号处理(语音增强和分离)、VW(语音唤醒)、ASR(语音识别)、VPR(声纹识别)、NLU(自然语音理解)、DM(对话管理)、NLG(自然语言生成)、TTS(语音合成)等在内的语音全链路引擎,为其语音交互提供强大的智能后盾,去做面向车场景的技术创新和落地。
为此,斑马智行和达摩院一直在探索其语音助手的内涵,那就是不能让所有的交互基于产品经理的定义,不让用户感觉到这只是一个替代他去操作的交互系统,而是更像一个能理解用户、具有一定认知力的智能体。
而这样的智能助手,在斑马智行看来第一步一定是要会“成长”,而这个成长必须让用户能感知。
“如果将AliOS智能座舱操作系统比作大脑,那么智能助手就是大脑里面装的具体知识,只有在容量足够大的时候,才能够把足够的知识、逻辑给塞进去;但只是大脑的容量足够大还不行,唯有不断学习才可以做大规模的创新。”
吴晓敏表示,第二代自然交互系统的核心问题在于“用户会认为一次讲过,但下次仍无法明白其意图”的系统“傻”,而通过自学习系统,则可以让智能助手的能力以指数级成长。
而这个“通过一定时间就可以明白上一次用户所指示的功能和技能,并把学会的内容分享给其他用户使用”的智能语音助手虽然领先行业半步,却把一个能自我成长的鲜活产品呈现在用户面前。在吴晓敏看来,这个半步的创新优势将为用户提供完全不同的体感。
“届时,斑马语音助手基于AliOS的融合创新,就能够把基座的能力发挥出来,通过用户感知的渠道——语音,变成用户可感知的产品能力。”
为了满足这一个“成长”的需求,斑马智行在全新系统中首创养成式语音助理“小跟斑”。基于“达摩院”人工智能学习平台提供的“达摩引擎”打造,集语音识别、合成、语义理解等技术于一身,并融入天猫精灵强大的语音交互能力、AI服务能力和生态资源,实现系统级语音能力实时迭代成长,让语音助理真正做到“听得懂、学得快、会得多”。
不仅如此,小跟斑在车载语音交互系统上的升级还体现在:
1.可以随时交互,主驾不再需要唤醒斑马;
2.多模态超强语义拒识:融合语音、视觉、车身感知等模态,重新定义了拒识能力,性能是单模态语义拒识的10倍,无效语句直接过滤,结果也不会显示在屏幕上;
3.多音区全场景交互。
吴晓敏认为,在智能助手发展的早期阶段,斑马智行开发“可成长”的智能能力只是一个开端,后面还会陆续进化出更多的能力,让智能助手的产品能够给用户带来更多智能的体验。
据了解,小跟斑的成长可分成两个部分,会针对用户的个性化表达仅对单个用户生效;也会将用户都在问的共性问题作为通用知识放入大系统内,供所有用户使用。
“斑马智行通过跟达摩院合作车载语音交互的技术,深度打造一个能够自学习、会用户语言的系统。达摩院的核心算法,加上斑马智行在车业务上的创新,可以构建整个学习闭环,进行有效分工。”
吴晓敏认为,在这样的分工下面,让整个研发效能得到了极大提升,而这也成为了斑马智行不断创新探索的原动力。
小跟斑的面世意味着车载语音的进一步发展方向,未来车载语音智能助手会迎来发展井喷时代,而自然对话交互2.0的系统则会像指令式交互一样,被市场和用户慢慢淘汰。
“智能座舱仍处于早期发展阶段,很多厂商仍未有实力去达成这样的基座,而这也成为了斑马智行的机会。我们将以天瀑AI平台开放所有的能力,去跟更多还处在追赶阶段的厂商,去开发出属于他们自己的智能助手系统。”
吴晓敏透露,未来,除了洛神系统外,斑马智行还会慢慢把这样的一些能力开放更多的系统版本里面,同时也在开发下一代的版本小跟斑智能助手2.0。
未来十年,斑马智行将赋能车企迈入语音交互的新智能时代。