【猎云网(微信号:ilieyun)】8月29日报道 (编译:Henry)
谷歌近日宣布,其轻量级搜索程序Go正式推出网页朗读功能,此功能几乎可以阅读所有网站,该应用现可以朗读二十多种语言,能够高效地帮助人们听取文章和网页内容。
该服务专门为那些网络“听众”用户们或者那些因忙碌而无法抽出时间阅读的人准备的设计,这些用户往往更倾向用“收听”的方式听取互联网上的文字内容,比如一些篇幅较长的文章、新闻稿件、电子书等等。这项服务还为用户提供暂停、播放和2倍速阅读等功能。
当然,与此对应的亚马逊的Alexa也可以阅读来自带朗读功能的Kindle书籍。
谷歌副总裁Yossi Matias称,未来谷歌可能会使用类似的语音转换系统来为人们朗读那些热门Google应用或服务中的文字内容。
他还表示:“它的未来有巨大的发展空间。我们在各领域应用语音转换功能时总会考虑如何改善体验、如何使其更自然、如何让用户适应它、如何实现个性化,这些有趣问题其实都是我们未来的探索方向。”
Matias的研究领域是搜索引擎和人工智能的结合,他也是特拉维夫谷歌研发中心的负责人,在那里的工程师们主要从事与Google Trends和Duplex相关的研究工作。
Matias说,今天宣布的搜索程序Go朗读功能还只是我们迈出的第一步。工程师们正在继续研究如何使语音服务更自然化、个性化。
Go其实涵盖了多种AI,其中包括用于执行语音转换技术的AI、识别页面文字内容的AI和筛选页面阅读内容的AI。相关团队甚至在考虑为将来的Go添加网页中的图片描述功能。
Matias还表示,谷歌工程师正在开发搜索功能的“字典模式”,该功能会根据程序读出的每个单词,实时突出文本中单词,因此这也可以为人们提供学习新语言的途径。
“其实,我们正在从零开始”Matias 说,“当我们考虑到文本理解领域,想要让AI能够分析内容并据此决定朗读内容时,各种有趣的想法就涌上来了。其中一个是摘要阅读,另一个是当涉及较长的文本时,AI可以找到让用户最感兴趣的部分。”
Go使用 WaveNet语音合成系统生成生动的人声,并提供26种语言版本。这款Google搜索轻量级应用目前在28个国家/地区上架,包括巴西、印度尼西亚、印度以及尼日利亚、肯尼亚、南非和加纳等许多非洲国家/地区。
谷歌今天在Google 4 India活动上宣布了Go应用程序网页朗读功能的消息。谷歌副总裁Scott Huffman表示谷歌助手的使用率今年在印度上涨了3倍。
Go 的朗读功能是对话AI科技的最新应用,现在已成为民主化发展中国家人民获取信息的一种途径。
今年,与哥伦比亚政府合作的Cainkade Studio推出了My Line系统,通过该系统用户通过电话会话的方式就可以从谷歌助手获取信息(无需网络)。
在上周,Uber的产品负责人Jairam Ranganathan表示,他们可能会使用会话式人工智能来实现世界各地优步拼车服务的自动化,比使用智能手机的应用程序,人们可能对手机本身更感兴趣。