【猎云网(微信号:ilieyun)】8月28日报道 (编译:孙家乐)
编者注:随着人工智能的发展,语音助手服务成为了人们生活的重要部分。但是现今的语音助手服务仍然存在不足,不论是过度炒作、语音识别难度大还是出现问题的最终责任人等问题,都影响着语音助手服务的发展。想要在这方面取得进展,必须反对“一刀切”,要有创新,也要联合所有相关人士的智慧,一同解决难题,推进语音助手服务的发展。
由Venture Beat在加利福尼亚州米尔谷举办的聚焦人工智能的活动中,负责Google Assistant工程团队的谷歌副总裁Scott Huffman分享了一些有关如何通过语音助手创建持久体验的见解。成为一个人日常生活的一部分有助于推动人们的接纳人工智能服务,例如:Google Assistant“创建提醒”或“播放音乐”指令的使用次数可能会是谷歌搜索查询的40倍。
Huffman很会从平台角度分享独特见解,但这只是一个方面。另一方面是大量的开发人员、初创企业和服务提供商在进行自己的第三方体验,这些体验会给Google Assistant或Alexa的工作带来帮助。
炒作会破坏价值
在过去的几年里,机器人和人工智能或许取得了比科技行业的其他任何部门都长足的进步,但同时也受到了过度营销甚至是虚假宣称的影响。一段时间后,想要从谣传中分辨真相就成为了一种挑战。
Voicera公司的首席执行官Omar Tawakol表示,这种夸大其词的炒作会带来一些不良后果。
他说:“我讨厌炒作,因为炒作破坏了价值。因为从长远来看,当你有一个很好的创新想法时,它通常会超出你之前的想法,但在短期内,它会被过度夸大,以至于你在两个想法之间都会有不理性的行为。当你没有足够的耐心把自己的创新想法发展到最终阶段时,你就会找一些办法来炒作。这对投资者而言是有利的,但对于你而言是有弊的。”
Pull String首席执行官Oren Jacob表示,围绕人工智能助理的炒作并不新鲜。Pull String是一家帮助客户为Alexa和Google Assistant创建语音体验的机构。
Jacob说:“自从Siri第一次在电视上播出以来,这个行业的前景就一直面临威胁。”
这并不意外,Tawakol表示兑现承诺是对用户是否会选择升级到他公司的转录服务的付费版本的很好预测。
他说:“准确性和相关性只是核心,特别是如果你要把这封邮件转发给某个人,那它的内容最好是完美的,我认为我们现在还不够好。但每时每刻我们都在越来越好,而且我觉得我们还没有达到这个行业已经兑现了承诺的地步。”
缺点即是机遇
Alpine.ai.为品牌和公司制作语音应用。首席执行官Adam Marchick说,在创建该公司之前,他的语音分析平台被3700多名语音应用程序开发人员用来跟踪性能,并找出有效的解决方法。
今天,他的公司正在帮助Petco建立PetCoach Google Assistant功能和Alexa技能,它可以告诉用户宠物吃什么东西是安全的。
他说:“我们已经从所有分析中明白我们现在没有机会获得100%的匹配率。”
Marchick说,语音应用程序开发人员知道这项功能不能回答每个问题,所以不需要让每一个查询都变得失败,从而使用户失望。
他说:“Pet Coach不会回答‘你能重复一遍吗?’或者说一些错误的内容,而是会讲‘这是一个伟大的问题。我们现在没有你的答案,但我们的兽医会很乐意回答的。如果你留下你的电话号码,当我们得到答案时,我们会给你发短信。’因为这是一个对该客户的高价值搜索查询,它将激发对客户的亲和力以及增加商店内的访问。”
他说,这种方法可能与绝大多数语音应用的货币策略不符,因为它需要快速维护和信息支持,但这是一种规避缺点、确保客户感受到被关照的方法,也有利于完善该应用的智能知识库。
语音应用程序发展艰难
人工智能助理们正在开发越来越多的视觉界面,比如电视和智能显示器,但想要鼓励采用第三方语音应用程序来建立一个没有主页的界面依然很艰难。
Marchick说,仅仅因为可以直接访问语音应用程序的语音命令并不意味着人们会在最常用的用例之外使用它们,例如设置计时器、听音乐或播客。
他说:“对于一个品牌或零售商,甚至是一个游戏,想要形成一个没有用户界面的习惯,并棋王只需要一个命令就可以达到目的,这种事情现在还做不到。”人们更有可能通过问“我的猫能吃鸡蛋吗?” 来获得Pet Coach的回答,而不是说“好的,谷歌,和Petco谈谈”。
谷歌和亚马逊已经开始推荐一些语音应用程序来回应自然语言的问题。
Jacob说,事实是,今天消费者可做出的大多数选择都并不是很好。他说:“我会评论说,很多技能和行动基本上都很糟糕,而且回归用户和花在他们身上的时间都显得非常糟糕。”
语音应用程序可以帮助增加人工智能助理提供的服务,其中之一是选择一个特定的主题,并深入研究,而不是试图像Alexa那样,为各种各样的问题提供通用的事实答案。
这方面的一个例子是PullString的Westworld Google Assistant。
他说,因为做得很深入,所以一些用户花了一个多小时来玩游戏。
他说:“这是一种特别有针对性的虚拟体验,因此它是有限度的,如果你能将它绑定起来,并左右约束,你就可以进行深入研究,因为你不需要回答任何宇宙般深奥的问题。这就是Alexa、Siri、Cortana或其他助手的承诺的张力。”
不能“一刀切”
Voicera有一个罕见的区别,那就是它是一家拥有投资者的人工智能公司。其投资者来自于人工智能行业的一些最大竞争对手,包括GV(前谷歌风投公司)和Microsoft Ventures。
但与Pullstring或Alpan.ai不同的是,它试图为企业客户而不是消费者创建服务。
当公司第一次提供EVA助理来记录会议和突出行动项目时,参加会议的人必须主动地说出这样的话:“OK,Eva,这是一个行动项目,提醒我发送一份演示文稿,谢谢Eva。”在发布后的一个月内,用户就让Voicera明白了这是个糟糕的主意。
Tawakol说,一位首席执行官把他拉到一边,说要摆脱指挥结构,因为他不想打断一个10到15人的会议,以记录一个行动项目。
他说:“这教会了我们,对企业而言,你不能复制消费者的使用模型。”
语音很难做
与键盘或屏幕上点击按钮的精确性不同,语音界面会带来一系列其他用户界面中不存在的挑战和细微差别。
Jacob说:“在语言方面,人类语言的模糊性一直在向你袭来。话题的变化是迅速而直接的,谈话中的声音没有连续性。口语是由片段:呃、啊哈和口吃组成的。”
要确保助手理解带有口音的人,主要的语音计算平台可能将需要多年的工作才能做到。而且,一般来说,语音接口带来的挑战并不像键盘或触摸屏界面上的那样容易解决。
考虑亚马逊和谷歌的商业选择
Marchick说,要明智地选择你所选择的垂直方向。例如,你也许可以依赖亚马逊而不涉足你的业务,但其他垂直市场却不能这样说。
“我认为游戏是非常安全的垂直市场。如果你建立了一个引人注目的游戏,他们所要做的就是推销你,因为它可以销售更多的设备。它带来了更多的日常活跃用户、更多的参与。正如Yelp在网络上发现的那样,如果你去旅行或做当地的生意,你就得仔细瞧瞧能获得多少交易。但如果你想要做语音的话会比这难上一百倍。”
Jacob同意这一评估,并补充说,在Alexa平台上建立电子商务体验应该会给你带来一些停顿。他建议在这么做之前,先与亚马逊沟通一下。
出了问题,谁来负责?
与第三方平台的人工智能助理一起制作语音应用的开发商和品牌,必须弄清楚,当体验失败时,责任在哪里。
Jacob说:“我认为你已经注意到并将会看到不同的科技巨头对于标准是什么做出不同的决定,语音操作系统方面负责的对话数量和第三方开发者的数量两种观点针锋相对。这十分不清楚,事实上,你在问谷歌(一个问题),但PETCO会回答:它在这条标准的两边浮动。”
语音应用的操作系统目前在市场上处于一个动态移动的位置,开发人员和平台都必须共同努力,以整合第三方开发人员为Alexa和Siri等助手带来最佳贡献。
Jacob说:“我们正在互相推动着把这些方面的东西整理出来。目睹我们进步,以决定我们如何能够最好地为它作出贡献,是一件非常重要的事情。”