【猎云网(微信:ilieyun)】9月19日报道
9月19日,索尼在上海召开了数码录音棒新品暨“还原真实的声音”行业论坛发布会,发布会上,搜狗CTO杨洪涛以及搜狗AI交互事业部负责人王砚峰就听写服务对录音笔行业的赋能以及与索尼产品的深度合作进行了探讨和发言。这也是搜狗在AI创新联盟成立之后首次与合作伙伴一同发声,搜狗正在不断践行通过AI技术引领录音笔行业变革的行动。
对此,媒体和舆论观点极为一致,认为搜狗开放听写服务能够解决录音笔产品诸多痛点,为录音笔“赋能”使其重新焕发活力,从而避免MP3的式微命运,再加上AI创新联盟的成立,将会推动录音笔行业的AI化升级与发展,甚至会开启一个全新的“录音笔AI时代”。
那么,搜狗听写服务到底有没有这么“神奇”?笔者专门就此进行了体验。
接入简单便捷,为录音笔打造AI“操作系统”
此前,搜狗CEO王小川在听写服务开放的发布会演讲中表示,搜狗的使命是“让表达和获取信息更简单”,希望“通过AI技术为各行各业提供更多帮助”,而根据搜狗CTO杨洪涛和AI交互技术中心总经理王砚峰的诠释,搜狗不是开放一项技术而是开放一个完整的服务能力,类似于微软推出Windows、Google推出安卓,搜狗是在做一个录音笔OS、一个AI“操作系统”。笔者认为,搜狗其实是把单纯的听写技术转变成一个完整的服务链,再把它提供给AI创新联盟成员和其他行业合作伙伴的录音笔产品进行使用,合作伙伴不需要进行硬件调整即可自动适配,当用户购买这些录音笔之后,即可享受到便捷、高效、准确的搜狗听写服务。
在实际使用方面,搜狗听写服务可以通过蓝牙、USB和数据线连接等方式,支持PC、移动、web多端接入,方便快捷,可实现听写工作的全面管理。在PC端,搜狗听写服务与搜狗输入法打通,在进行USB或数据线连接之后,输入法即可自动检测录音笔硬件并为用户提供听写服务;在移动端,搜狗此前有个专为自家录音笔开发的“搜狗录音笔”APP,之后将会升级成为全行业提供听写服务、功能更完善的“搜狗录音助手”,因“搜狗录音助手”尚未面市,以“搜狗录音笔”APP为例,只要用户打开手机和录音笔蓝牙功能,简单查找之后即可连接并享受听写服务。
(“搜狗录音笔”APP设备连接页面)
尤为值得一提的是,因为与搜狗输入法账号体系打通,搜狗听写服务不仅能够为录音笔进行技术升级和AI赋能,更能带来庞大的流量池。可以预见的是,未来应用这一服务的用户会越来越多,录音笔的用户群体也会因此得到扩展,整个录音笔行业都会因此受益。
转写快速准确,让录音听写工作变得极其简单
过去,会议记录、新闻采访、课程备份等录音听写工作十分繁重、枯燥,事前需要录音,事后需要多次反复听写,因为录音质量、被录音者口音问题、记忆模糊无法印证等原因,还常常会产生遗漏和错误,甚至丢失关键信息。所以,传统录音笔才会在用户需求的不断升级中逐渐被边缘化,甚至显露出被淘汰的迹象,有可能步MP3的后尘,而近期市面上出现的一些采用了AI技术的录音笔新产品,只是单个产品或单个企业的创新,并没有从根本上解决这一系列问题。
对于绝大多数相关从业者来说,录音不是目的,录音之后整理成文进行保存才是目的,在这方面,搜狗开放听写服务可以说是最完美的解决方案。从最基本的用户需求来说,在接入搜狗听写服务之后,录音笔可以实现“实时转写”和“非实时转写”两大核心功能,官方宣称实时转写准确率可达95%,非实时转写“录音1小时出稿5分钟”,准确率与实时转写一致。经过实测,在笔者普通话并不标准的情况下,搜狗实时转写准确率与官方描述基本相符,不准确处主要受口音、生僻字词和断句影响,而非实时转写速度则高于官方描述,1小时录音只需要3到4分钟即可出稿。
(澎湃新闻朗读原文和搜狗听写实测结果页面对比)
搜狗听写之所以能够实现同步转写和较高准确率,主要得益于其强大的AI技术和能力。此外,搜狗首创云端智能纠错编辑技术,不仅具备良好的自动区分说话人、智能文本顺滑、标点预测等能力,还能基于词图搜索和输入纠错模型,帮助用户对转写结果进行纠正;而基于搜狗输入法的海量词库,搜狗听写可以为用户建立个人词库,使其常用的专业词汇、人名地名会被轻松识别。可以说,搜狗听写服务的开放可以让过去的录音工作从“反复听写”变成“声落成文”,能够让录音听写工作变得极其简单,而这能够大大加强录音笔的竞争力。
服务周到贴心,颠覆原有录音场景重塑“新声态”
当然,在以万物互联为目标的5G互联网时代,录音笔要想重新焕发生命力、重回电子产品主流阵营,仅仅满足“实时记录,快速转写”的核心需求是远远不够的,因为这样的录音笔依旧还是录音笔。不过,搜狗听写服务的能力可不止于此,其能力上限也远远没有达到。
事实上,除了“实时记录,快速转写”,搜狗听写服务还集“多段同步、云端存储、同声传译、一键分享”等功能于一体。也就是说,当录音笔接入搜狗听写服务以后,用户不仅能够从繁重枯燥的听写工作中彻底解放出来,还能够享有“多端同步内容编辑、文件云端安全存储、中英文同声传译、人性化便捷分享”等增值服务,真正享受到“录音、转写、编辑、存储、分享”一站式录音转写解决方案带来的愉悦体验。
(搜狗听写服务自动存储和文件分享页面)
从这个角度而言,这些周到贴心的服务实际上是在颠覆传统的、原有的录音笔使用体验,创造一个录音笔“新物种”,而搜狗开放听写服务和牵头成立AI创新联盟,无疑是在重塑录音笔行业生态,而众多录音笔生产商在硬件升级的基础上得到搜狗听写服务的加持之后,或将迎来全新的发展阶段。
(发布会上,搜狗方面关于听写服务的期待)