【猎云网(微信:ilieyun)北京】5月22日报道
在动画片《名侦探柯南》中,柯南有一个重要的破案利器,那就是阿笠博士送的变声领结,得益于它,柯南可以将声音伪装成其他人,从而隐藏自己的真实身份巧妙破案。如今,在搜狗输入法的帮助下,这个变声功能已经跨越二次元世界,出现在我们的真实生活中,只需在手机上轻轻一点就可以让我们完美变声。
5月21日,搜狗输入法正式推出“语音变声”功能,该功能可以将任意用户的说话声音实时变换到指定角色的声音。简单来说,你只要在语音输入中输入想说的话,再选择一个喜爱的角色,你的声音就会瞬间被转换成该角色的声音。这种以前只能在影视剧中被特工间谍等神秘人士用到的黑科技,现在搜狗已让它飞入寻常百姓家,让大家的沟通乐趣无限。
语音变换,看似简单,实则在实现的过程中会遇见很多技术难题。最核心的问题是,每一个人的音调、音色和节奏都不相同,这世上有多少人,就有多少种语音,如同指纹,语音也是每个人独一无二的生物编码。如何将“千人千声”通过技术处理,变为同一种指定声音,同时还不丢失原说话人的语言习惯,这不仅是搜狗面临的挑战,也是国际上普遍承认的技术难题。
深耕AI语音技术多年的搜狗,在深厚的技术积累下,完美攻克该难题,让搜狗输入法“语音变声”功能具备了三大亮点:首先,还原度极高,变声到指定角色的音色与该角色的原始音色十分相似,几乎可以做到以假乱真;其次,自由空间大,搜狗这一“变声”功能对用户本身的音色没有任何限制,每个人均可变声到预先指定的音色,真正实现了“任意人变声到同一人”的功能;最后,搜狗输入法打破音色转换的局限,将用户输入的语音内容、语速、停顿、情感等均转换为超高逼真度的指定角色声音,因此可以实现更自然的变声沟通。而且在搜狗AI语音技术深度学习功能的加持下,随着处理语音数据的增多,搜狗输入法“语音变声”功能的智能化程度将会不断提高。
目前,在搜狗输入法“语音变声”功能中可供选择的语音角色横跨互联网、明星类、动漫类等多个类别,有近20种五大类的声音,包含了大家耳熟能详的周星星、蜡笔小新、小猪佩奇等多个不同年龄、不同性别甚至是不同“次元”的角色。在固定的人物和角色之外,搜狗输入法还提供了大叔音、萝莉音、公子音、御姐音等基础声音,在聊天过程中,用户可以在这些角色中自由转换、无缝对接。
能在全球率先实现如此有趣,花样翻新的语音输入功能,是搜狗公司创新基因的体现。正是由于不断创新,让搜狗输入法在不断完善基本功能的基础上,首创了许多花样玩法,比如之前的花漾字,键盘音,斗图等等,一直引领着行业的发展方向,不断为用户带来惊喜。
不满足于过去的成功,凭借对科技发展趋势的精准判断、对人工智能领域研发的不断投入和技术团队的不断攻坚,搜狗在基于语义理解和语音识别的人工智能探索领域里,技术能力正在以超乎想象的速度得到不断提升。作为未来万物互联的重要入口,语音技术已成为各大科技公司发力的最新战场,相信继搜狗输入法成为用户首选之后,在语音输入领域又会成为行业新的标杆。