【AI星球(微信ID:ai_xingqiu)】9月5日报道(编译:Timo)
印度班加罗尔的一家人工智能公司开发出了一款能将语音输出为文本的语音识别应用。和其他市场上已有的像Speechnotes和ListNote或是谷歌的应用不同,这款名叫Liv.ai的应用能够支持印度本地的多种语言并能区别不同的方言,口音以及语调。
该应用能够在嘈杂环境中正常使用,确保有效内容能最大录入的同时也让错误率降到最低。
有了这款应用,印度的亿万网民在用Facebook或WhatsApp聊天时更方便地将语音转为文字发送给对方了。
Liv.ai不只是语音转文字的应用
Liv.ai的同名公司于2015年成立,公司的三位创始人分别在花旗银行、微软、高通和三星有过工作经历。
由于Liv.ai采用精准的类神经网络模型以及其延迟非常短,这款应用所提供的语音API和SDK接口能让开发者进行语音功能的对接和应用。第三方可以以此为基础开发出本地语言的电子助手,或者转录音频视频文件,建立基于声音的IVR(互动式语音问答)或是进行智能语音分析。API接口能够让应用支持各种手机,平板,PC,电视,音响,机顶盒,汽车系统等设备。
除了英语之外,Liv.ai还支持八种印度境内使用的语言。
这款应用有不少大有发展前途的亮点。
- 语音打字:语音到文字的输出使得聊天,写邮件等等变得更加省力,人性化。
- 网上银行操作:印度的许多银行客户都选择使用网上银行进行转账交易等,而繁多的单据和表格的填写对于一些乡下地区的教育程度不高的人来说依然是个问题。而ai就能让用户用语音指令完成单据的填写和交易,至少能节省三分之一的时间。
- 教育:ai还可以被用于录制演讲,抄录笔记,语言评测的学习过程中。对于盲人学生更加方便,考试或是做作业只需要说出想表达就可以了。
- 车载娱乐:ai可供开发者进一步利用到车载娱乐上,语音指令能够让系统快速完成诸如切换播放列表,调节音量等操作,避免用手操作存在的潜在安全隐患。
- 智能设备:与车载娱乐类似,ai能让家居变得智能化,语音指令让用户可以自由控制家电等设备。
目前除了众多产品带有用户操作界面的公司外,一些电商平台和政府机构都在使用Liv.ai。政府利用Liv.ai来获取市民的反馈,一些公司的客服中心用它来做语音搜索。由于反馈的语音信息能马上被转录为文字直接进行进一步的分析,该应用能有效帮助减少人力和时间消耗。
Liv.ai目前已获国内外多个投资方的投资,但具体数字并未公布。
公司CEO Subodh相信在人工智能领域方面会有不少机遇,他表示:“现实中有太多多余且机械化的工作,许多产品的操作界面也设计得过于复杂和不人性。随着人工智能的发展,这两方面的问题都能得以解决。我们的目的就在于让机器与人类的互动能尽可能更直接省事。”