高开180%市值超130亿,“宁王”收获一个IPO
高开180%市值超130亿,“宁王”收获一个IPO
携程Q3大“赚”,但还能更“赚”
携程Q3大“赚”,但还能更“赚”
较劲的Q3:乐观者李斌,“史上最强”何小鹏,李想开上法拉利
较劲的Q3:乐观者李斌,“史上最强”何小鹏,李想开上法拉利
捷豹重生改命,LOGO大变样,马斯克:你们还是卖车的吗
捷豹重生改命,LOGO大变样,马斯克:你们还是卖车的吗
立即打开APP
grace33
私信
7

易容术算什么,Lyrebird连声音都能模仿合成!电话诈骗还能防得住吗?

2017-04-27
早期项目
要是音频被居心叵测的人不当地利用篡改,后果将不堪设想。

【猎云网(微信号:ilieyun)】427日报道(编译:黑白灰)

随着人工智能技术需求的爆发,一场新的语音革命即将到来。对此,蒙特利尔初创企业Lyrebird抓住机会,推出其语音合成服务。对于该创企所发布的最新服务,我方暂时先持观望态度。据悉,Lyrebird对外声称,此项API通过对1分钟语音文档的部分信息进行筛选采集,随后进行重组,最后可以变成任何人的声音,这无疑在全球范围的人工智能领域掀起新一轮的高潮。这同时也意味着,语音合成技术的成熟,想模仿谁的声音就模仿谁的声音,真假难辨。比方说你就可能会听到美国总统特朗普向加拿大宣战的语音文件。

Lyrebird早前在网络上发布了几个非常逼真且有说服力的音频样本文件。Lyrebird表示该应用可以生成任何语音片段,即使模仿对象没有说过类似的原话,也可以通过对语言的原始波形进行建模,收集并分析原始音频材料,之后再将之拼接成一段完整的语音,甚至还可以通过再加工,组合形成各种不同的语调。

如果你感觉对这项技术有点似曾相识的话,那么很有可能是因为你在去年11月份对Adobe推出类似的音频编工具有所耳闻。不过这款被称为音频界的Photoshop的Project VoCo却需要20分钟的音频素材,以及大量合成所需的系统资源。相比较而言,Lyrebird使用较为便捷,只需要1分钟的音频素材,随后通过基于云的API来处理音频,再转录生成一段全新的录音。

在我去年报道Project VoCo的时候,我就心存疑虑,随着这种软件的开发普及,在享受新鲜感的同时,很可能会给人们带来许多误导性的信息,人们从此无法简单地通过声音识人和辨人,人和人之间变得无信任可言。

果真,这次Lyrebird从道德的角度分析道,由于此项技术的应用,使得录音可以轻易被修改,导致了这些音频证据的有效性,合法性受到广泛质疑。该公司又补充道:

我们公司将这项技术向世人推广,并以此激励大家,为用户带来福祉,所以我们希望大家能好好利用这项技术,确保不会发生类似信任风险。同时,希望这项技术不会被别有用心之人在不同领域滥用,通过模仿别人的声音做一些违反乱纪的事情。更普遍的是,目前,无论是在媒体还是法律领域,录音都是证据中的一个重要形态,然而,根据当前情况看来,录音很有可能在未来会被拿来做伪证,混淆案件发展方向。在此,我希望音频技术能健康稳定地发展,最好在未来给音频“打上水印”。

不过,即便如此,用户对于Lyrebird的质疑声还是此起彼伏:图像处理工具的广泛普及应用会影响新闻媒体和网络媒体上传照片的真实性,以及模糊了原图的真正出处。除此之外,要是音频被居心叵测之人加以不当地利用篡改,后果又将不堪设想。

这款产品本身就是把双刃剑。Lyrebird除了能模仿世界领导人的声音以外,还有一点不得不引起注意:人们有时根本分不清电话那头到底是真的至亲挚友还是行骗之徒,本以为只是和家人简单的家常里短,却成了诈骗犯有利可图之处。或是电话那头传来像极老板声音所下达的不合常理的指令,员工往往照做,上当受骗后也无计可施。

猎云网APP阅读全文

体验更加

猎云网

微信扫码关注猎云网

  1. 猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权;
  2. 转载时须在文章头部明确注明出处、保留官方微信、作者和原文链接,如:转自猎云网(微信号: lieyunjingxuan )字样;
  3. 猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
  4. 联系猎云,请加微信号:jinjilei
猜你喜欢
长按图片可以分享给好友
×