【猎云网(微信号:ilieyun)杭州】4月19日报道(文/陈天琪)
第三届中国数字阅读大会的“数字阅读+智能峰会”由科大讯飞与咪咕数媒共同举办,峰会围绕“智能出版·全民阅读”主题,旨在探讨科技对出版行业的发展助力,挖掘“人工智能+出版业”的发展机遇,用AI重塑阅读新生态。科大讯飞消费者BG高级副总裁章继东发表了演讲,他提到了人工智能的三个法宝:
1、深度神经网络依赖于核心算法;2、大数据,深度神经学习是需要一些大数据的积累的,在传统的这种计算模型下,在数据一定量的时候会达到瓶颈,整个维度和效果就不能再提升。但是在深度神经网络的这种学习数据,效果会越好;3、涟漪的效应,就是迭代的效益,核心算法加大数据,加上研究工程产品和用户的一个闭环,不断的迭代。
以下是分享实录:(猎云网有删减)
讯飞在智能语音和人工智能这个领域已经深耕多时,今天想跟大家分享的主要是讯飞对于人工智能的一些认知和思考以及跟各行各业的结合,最后想阐述和展望一下人工智能跟阅读、出版行业的一些结合点。
人工智能有哪些不同的层面呢?讯飞在2014年就提出了人工智能的划分,大概是3个层面的东西。一、运算智能,运算智能实际上就是指机械能存会算。大家都知道人类的运算的能力要比机器要差很多,无论是机器在国际象棋上打败国际大师,还是去年的AlphaGo,其实让机器发挥的最重要的作用就是存储和计算的能力。二、感知智能和运动智能。这种能力是让机械能听会说,能看会认,能抓能握。三、认知智能。让机器能够会思考,能理解,会思考,这也是最难的。其中有逻辑推理,知识学习和语言理解的东西在内,是人工智能最大的一个挑战。
那人工智能跟技术和产业的融合发展是什么样的情况呢?
首先我们看看人工智能3次浪潮,第一次就是1956年达特茅斯会议之后来产生的第一次浪潮。第二次是1980年左右,第五代计算机兴起,这时候中国开始施行863的计划。到2000年,正好是AI的第二次冬天,讯飞也刚在1999年成立,当时是非常低谷的时候。第三次浪潮是随着机器人的不断的提升,包括在深度学习等等这些核心算法上的一些突破,其实核心技术产业的深度结合让现在成为真正爆发的前夜。
所以人工智能为什么具有绝对的前沿性,成为各个国家现在争夺的领域?就是因为在这一个领域里面,无论是中国还是美国,都是在同一起跑线上。
很多观点认为大数据就是人工智能,但讯飞提出的观点认为人工智能至少有3个法宝。一、深度神经网络依赖于核心算法,现在最深能够达到1500个深度。二、大数据。毋庸置疑,深度神经学习需要大数据的积累,学习数据越多,效果会越好。三、涟漪效应。涟漪效应就是一种迭代的效益,核心算法加大数据,然后再加上研究工程产品和用户的闭环,不断的迭代,才有可能把事情做好。人工智能应用到各个领域,如果没有这三大法宝是做不好的。
讯飞也提出,讯飞的人工智能就是我们提出的讯飞超脑,让机器能听会说,再到能理解会思考。同时我们做了一个内容答题机器人。这是科技部启动的首个中国人工智能863重点项目,讯飞也是牵头单位。目标是达到3到5年内能够让机器人考上大学。对于人工智能来说,其实是从两个方面来改变生活,第一个方面就是自然交互。终端的消费者本身面向各种设备能够自然交互。第二个就是智能学习助推行业,要让人工智能的这种技术和能力应用到各个行业,因为现在没有所谓的通用性的人工智能,人工智能一定与行业紧密结合起来。
说到交互,我们都知道第一代的交互式键盘加字符的显示,第二代的是鼠标加图形的显示,第三代就是以语音交互为主,触摸交互为辅的第三代交互。但现在的手机处于中间状态,以触摸为主。因为机器的图像理解还达不到要求。
我们把交互分成两个层面,一个是弱视觉交互,一个是强视觉交互。弱视觉交互就是像音箱耳机,手环这些没有屏幕的移动状态下的弱视觉呈现的语音交互。强视觉交互比如跟电视交互说我要看什么内容,从中又可以用云交互中间选具体影片,这里面有一个非常不同的交互的方式。讯飞推出了人工智能时代人机交互的界面——AIUI。它要解决方言识别、远距离噪音环境下交流、双全工等复杂问题。全双工就是当机械发出声音时可以随时只得打断它,就像跟人一样自然交流。我们推出的云平台,现在开发者现在已经有30万,日均的使用次数已经达到了35亿。
AI+交流层面,灵犀速记是一个典型,也是我们跟中国移动合作的业务,现在月活跃达到了1600万,我们自身的输入法月活跃有一个亿。AI+家庭方向,我们跟中移动的魔百盒以及各大电视等合作研发了语音遥控器,对想看的内容进行操控。AI+汽车领域,我们跟国内的所有的汽车厂商都形成了非常深度的合作。除了交互之外,人工智能要应用到各个行业,因为有了大数据核心算法和云计算,使得人工智能能够助力各个行业能够做一次更大的升级。
另外教育领域现在我们是服务7500万师生,这也是讯飞非常重要的一个事业。中国教育最难的一点就是学生太多教师太少,好的教师资源更是稀缺,怎么样达到因材施教非常的重要,机器可以解决这一问题,因为机器可以自主学习并且根据学生的不同点精准教学。另外,人工智能跟医疗的结合也是讯飞跟各大医院在做的一些事情,一是语音病历,二是图像识别,智慧医疗也是现在很多人工智能企业正在切入的一个方向。
对于人工智能的服务形态其实分为3个方面,一是信息完整性,这是第一个层次。比如说人类跟机器下棋,机器能知道我下的所有步骤,以及接下来落子所有的可能性,这叫信息完整。第二个就是信息不完整,比如打麻将,德州扑克这种就是信息不完整的,因为你不知道他手上还有什么牌。最后是自由型。这一块就是人类艺术创造的部分,现在主要做的是让机器获得顶级专家的知识,然后达到一流专家的水平,超过90%的普通专业的人士。如果这个行业他的专家稀缺性非常的强,机器就可以学习这些专家的能力,达到这些专家的比如百分之七八十的能力,就可以全面的把这种能力放到更很多重要的岗位。
最后回归到今天的一个主题。就是数字阅读和出版。我觉得我们在这个方面也做了一些探索和思考,首先作家写书,人工智能就可以做很多的事情,比如说语音录入,有的忠实用户就拿着讯飞输入法写过书的。再比如说手稿的OCR的识别,可以应用于全学科的阅卷。第三个就是文字校对,另外就是外文的翻译,这个可能也是出版业非常重要的一件事情。
发行层面,只要有足够的数据,或者深入到行业加长核心算法,在智能上也可以做很多的事情,内容审核、多形态的生产、销量预测等等。因为无论是移动化的场景越来越多、中国人口的老龄化趋势,以及所谓的中产的焦虑感,都希望用声音的方式来去获取内容,声音是具有情感特征的,能满足人们的情感诉求。对于读者来说的话,人工智能也可以改善和探索一种新的体验模式,比如说边看边听,还包括内容推荐以及个性化的朗读等等。在这里我很想提一个概念叫MGC,就是机器产生内容,未来的人工智能一定是机器产生内容,产生很多丰富形式的内容。
对于未来,人工智能在出版、内容、数字阅读上面有很多可以深挖的东西,所以我们是希望讯飞跟这个行业里面各个合作伙伴来一起研发,让人工智能来助力出版,助力数字阅读,因为我们始终相信,在中国,讯飞可以用人工智能改变世界。