【猎云网(微信:ilieyun)北京】9月1日报道(文/赵子潇)
9月1日,在2016百度世界大会上,百度首席科学家、百度大脑计划负责人吴恩达在会上发表演讲,阐述百度在人工智能方向上的重点战略。会上,吴恩达宣布百度语音输入法将在两个月后正式开放下载,深度学习开放平台和百度大脑平台均开放给开发者。
人工智能发展如此之快的情况下,它能给我们带来什么?吴恩达提出两点想法,第一,有一件事是正常人可以一秒以下做到的,可以使用人工智能来自动做;第二,假如在一个具体重复发生的事情你可以拿到海量数据,就可以用这些数据来预测下一次的结果。
在百度大脑的几个部分的能力上,吴恩达也根据不同能力特点发布相应的产品。在语音交互方面,百度使用的是端对端深入学习的系统Deep Speech,落地产品为两个月后上线的百度语音输入法。这是以语音为主的键盘,并且我们使用简单的自然语言处理能力使其能够理解你讲的话,比如用户说我很开心,输入法会推荐表情,直接说用户的需求,它也可以自动满足。
在自然语言处理方面,百度拿出手的是现如今非常流行的智能音箱。吴恩达宣布,百度和HARMAN公司开始了战略合作,为用户提供百度人工智能技术的智能音箱。事实上,百度在2014年的世界大会上就介绍了音箱项目,希望让音箱成为人的助理,也可以提供购物或者服务等有用的信息。而百度也开始和第三方的家电公司合作,输出人工智能技术,打造智能家居场景。
在图像识别方面,百度拥有着非常准确的人脸识别能力,合作了一家第三方公司研发智能门锁。其中使用到百度的人脸识别和活体识别能力。
综上产品其实都用到了百度的深度学习技术,百度也在今日宣布,将深度学习平台和百度大脑平台都开放出来。
吴恩达介绍,深度学习平台易学易用,且性能高效,百度内部的几千个工程师,都可以比较容易的学习,而且使用我们的深度学习来影响各自的产品。而在百度大脑开放网站,已经写了百度的技术能力,开发者去这个网站也可以开始理解这些技术,百度也会慢慢的把更多有关人工智能的培训资料放在这个网站上。
以下是吴恩达演讲全文,经猎云网整理,略有改动:
一百年前电能对很多不同的行业有巨大的改变,这包括通讯、生产、交通、农业等等,现在人工智能也会对很多行业有一样大的改变,我今天在这里的目的就是,我想输出百度的人工智能技术,让大家,让第三方公司,让你们实现行业转变,也想协助你们进入人工智能时代。
人工智能可以做什么
我做这件事,我今天带了三件礼物来送给大家,我们今天一件一件来打开。刚才Robin(李彦宏)已经讲了,在百度,百度大脑最核心的部分,我们有语言、图像,自然语言处理,用户画像,这些都是依赖于我们继续学习能力做的。我们知道百度就是一个人工智能公司,有意思的是你看一看百度最重要的产品,这些产品都大量依赖人工智能,包括搜索、广告、糯米、自动驾驶等等。在这些产品,我们人工智能做了好几年才可以做到今天的程度,我们刚刚上个月做了一个实验,我们把百度的人工智能技术,在内部输出给我们的工程师和产品经理,又安排了一个人工智能的工作坊,我们想看一看我们的人员可以使用我们人工智能技术,在一个月可以做到创新产品。
刚刚上个周六Robin和我看到这个结果,我给大家看四个例子,第一,我们有一个小团队用计算语言处理和机器学习能力做了一个巡警机器人,他可以自动打电话给客户,来自动挖掘线下风险,包括办证,色情,助考等等。第二个例子,我们也有一个小团队使用我们的机器学习技术做了智能写作助手,你写几句话,他就可以自动做词语替换,词语推荐,帮你修改文章。第三个例子,在我们贴吧产品,我们拿到一些图片,我们也需要做自动图片剪裁,本来拿到上面的结果,不过如果我们用我们的智能剪裁能力可以拿到图片下面的结果,提高用户体验。第四个例子,我们有一个小团队做了新的产品,如果你拍一张照片,看一看你穿什么衣服,就可以自动识别出你穿什么衣服,也提供你一个时尚搭配。这些创新的产品,这些创新的项目,我们的工程师可以月做成功,原因就是他们可以拿到我们百度大脑的技术,非常快的非常容易拿到最有用的技术拿来融合做工作。
有人问我,人工智能发展这么快,它到底可以为你做什么呢?我今天想给大家两点想法,第一,假如有一件事是一个正常人可以一秒以下做到的,我们就有很好的可能,也可以使用人工智能来自动做。你如果想输入一张图片,而且输出这个人的性别,好看不好看,一个正常人一看这张图片思考一秒一下就可以理解这个信息,这也是我们现在人工智能可以做到非常好的。第二个例子,我们的语音识别能力,刚才两位都讲过,你听一段语音不需要想太久,想一秒以下可以识别出语音说了什么话,这就是我们语音识别能力。第三个例子,你看一句话,这个烤鸭让我呕吐,如果问你觉得这个用户喜欢或者不喜欢这个餐馆,也只需要想一秒以下就可以知道,这也是我们人工智能可以做的非常好。
除了一秒以下的工作,在非常短期的时间,我们人工智能有第二件事可以做到非常好,就是假如在一个具体重复发生的事情你可以拿到海量数据,可以拿到很多数据,你就可以用这些数据来预测下一次的结果。比如说在百度我们有很多广告和有关用户信息,看过很多次,一些用户会不会点击不同的广告,我们就可以用一些数据来预测用户会不会点击广告。
在百度外卖,我们也看过很多有关餐馆和地址的信息,看了很多次,食物需要多长时间可以送给用户,可以用这些数据来预测下一次的配送时间。
我觉得在非常短期的时间,一个问题是一个正常人一秒以下做,或者这些预测下一次结果的工作,我们就在非常短期的时间人工智能可以做到非常有效。从长期的维度来讲,我也是对人工智能的未来充满信心。我希望未来我们会做到陪伴机器人,或者做个性化私教,做音乐作曲,做机器人医生,这些很多项目都是在研究阶段。
百度大脑四项能力落地到应用/产品
刚才Robin讲了百度大脑好几大部分的能力,我现在也想跟大家快快的把这些人工智能能力的细节再分享一下。百度大脑第一个能力就是我们的语音能力,其实在两年之前我们的语音识别准确率提高的非常快,为什么呢?你如果看传统的语音识别系统,你如果输入一段语音,你就需要先用一个声音模型,再用一个传统模型,再用一个语言模型才可以输出结果,在我们最领先的语音识别系统,我们叫Deep Speech,这是一个端对端深入学习的系统,你输入一段语音我们可以直接放进去,一个巨大的神经网络,这个神经网络就可以学习到怎么样输出准确的结果。我们其实发现你如果想用这种深度学习来做工作,就需要训练非常非常大的神经网络,做这些工作我们就发现,使用GPU才可以训练足够大的神经网络,来把这类工作做成功。
我们的语音识别准确率提高了,这对用户有什么好处呢?我们想知道在手机文本输入和语音输入那个办法会比较快,我们跟斯坦福大学的两个教授进入了一段研究,他们发现在手机,你使用百度的语音识别能力,你处理信息可以快三倍,而且你的错误率也降低,大家用手机想更快更方便,更自然的输入信息,我希望大家都会更多用百度的语音识别能力。
在百度最重要的产品已经支持这一类语音输入,我们就发现这些用户更方便,更自然,更快的用这些输入信息,使用这些产品。有一些公司传统的键盘是这样的,有一些公司听到了有新的语音识别能力,就想做一个语音键盘,他们就把传统的键盘在放上去一个小的麦克风按纽,就叫做语音键盘。我觉得这不是语音键盘,你如果要做一个真实语音为主的键盘,我觉得这才是语音键盘,放一个巨大的麦克风按纽,我希望大家想更方便使用手机,不仅用百度识别,我们希望大家用各种各样App可以非常方便快速的办法来输入。
我今天想带给大家第一件礼物,就是我们的团队正在做一个新的语音输入法,这就是语音为主的键盘,而且我们也发现如果使用一个简单的自然语言处理能力也能够理解你讲的话,也可以推荐表情,你说我很开心会推荐上类表情,你如果在聊天,想把第三方朋友电话号码放进去,也可以直接说你的需求,他也可以自动满足。
这个语音输入法两个月后就为安卓手机会上线,希望那时候大家会下载。我刚才讲的语音输入法,也用了一小部分,也用了一些自然语言处理的能力,我讲的第二个例子,从百度创立第一天,百度开始的是搜索公司,搜索需要大量的依赖自然语言处理,所以从第一天百度就有非常领先的自然语言处理技术,这里为大家举了几个例子,你说几句话,我们的关键词技术就可以自动输出,识别出关键词,刚才Robin讲了我们有非常非常好的翻译技术,我们可以做自动答题,也可以理解你的需求来为你提供设备控制。我们也发现除了搜索以外,我们的自然语言处理也对另外的产品有很大的用处。其实在两年前,我在2014年大会上,在这个台上为大家介绍了使用自然语言处理的项目,就是我们智能音响,那时候两年之前我用上面那张图为大家介绍这个项目。我们的想法,你如果在家里想听音乐,我们就不要你拿出手机解锁打开App点击很多次才可以选择你想听的音乐,我们想你坐在沙发上直接向音响说播放音乐,你就可以听得到。我们想音响可能变成你的助理,也可以为你提供购物或者说服务,也给你有用的信息。在这两年,我们自然语言处理和语音识别的技术都进步了很多,2014年音响,我承认它不太好看,其实它也不太好听。今天就非常高兴了,为大家宣布百度和HARMAN公司开始了战略合作,你们都知道这个公司是全世界非常非常领先的音响公司,在我个人的客房,我有一台他们的音响,我在家里觉得他的音质非常好,音响又好看,我在家非常喜欢用这个来听音乐。HARMAN是非常领先的音响公司,百度是非常领先的人工智能公司,在合作方面我们会把百度人工智能技术放进去,我们就会一起为用户提供又好看,音质又好,又智能的智能音响。
我希望在你们的家庭,你们的家电未来都会变得越来越智能,在你们家里音箱是一个非常非常重要的设备,除了音箱以外,我希望未来你的灯光,安保系统,窗帘等等都会变得越来越更智能,让它可以理解你直接说的需求,让你的家庭变得更智能,在百度也会开始跟第三方的这一类家电公司合作,使用我们的人工智能技术支持家电公司的工作。
除了语音和自然语言处理技术,我们技术第三部分就是我们的图像技术。其实在百度我们的图像技术已经对图像和视频得到非常非常深度的理解,我就给大家举个例子。第一个例子,你如果输入左边的图,我们可以自动输出下面那句话,告诉你这张图片的内容。第二个例子,你输入中间那张图也问那个问题,我们可以自动输出答案告诉你这是白色冲浪板。如果输入一段视频,我们可以使用百度大脑图像技术来理解这段视频,告诉你这是狗在房子里面玩。这些图像技术有什么用呢?其实Robin刚才讲了我们现在有非常好,非常准确的人脸识别能力,我觉得我们的图像技术有很多不同的用处,不过我们现在进行了一个智能门锁,跟第三方公司做智能门锁的工作,这就是使用我们的人脸识别和活体识别能力。我们的想法就是识别出你的脸让你进去。最后一个例子,使用我们的活体识别能力才做得到的。
百度大脑第四个能力,我们的用户画像,因为我们看到很多数据,我们就对用户有非常深度的理解,可以知道一个用户的性别,它的年龄,喜欢吃什么,喜欢穿什么衣服,喜欢去什么地方旅游,在百度我们也非常尊重用户隐私,所以我们的重点,到现在还是使用这个用户画像来支持内部的产品。不过我们有的时候也可以找到办法,找到可以保护用户隐私办法来使用我们的用户画像为第三方公司提供有效的工作。
在百度大脑我们各种各类的技术,语音图像,自然语言处理,用户画像都是依赖我们的继续学习来做的,我们内部的人员如果他们想用一个,我们已经训练好的模型,比如说一个语音图像等等模型可以非常快的选择最好的模型,非常快,非常方便把数据放进去。如果有一个团队有自己的数据,他们有的时候也会想使用他们自己的数据来训练自己的模型。其实现在在继续学习,我觉得最大部分的价值还是依赖一类技术,就是叫做监督式学习,这个监督式学习的意思是什么呢?他的意思就是说你如果想学习你输入什么,就需要输出什么。在百度有很多用户广告信息,你如果想学习输入用户广告的信息,输出一个用户会不会点这个广告,这就是一个典型的例子。在我们金融工作,你想输入一些有关用户的申请贷款的信息,输出一个用户会不会按时还款,这也是可以用继续学习能力来做的。
这几年来我们的继续学习能力重点还是支持我们百度内部的工作,我们近期已经开始使用我们的继续学习能力支持第三方的工作,我给大家一个例子,在百度我们的团队,我们开放云团队已经跟太原铁路局合作,做物流优化的工作。如果你有一辆火车,这辆火车从一个城市跑到另外一个城市需要多少时间,那段时间是比较难影响的。不过对物流有巨大的影响,就是你的中转时间,中转时间是什么意思呢?你如果一辆火车到了火车站,你把货物从火车转到仓库,从仓库转到货车需要多少时间,这就是你的中转时间,你把中转时间降低,对你的物流有很大的影响。
我们已经跟太原铁路局采集了很多有关物流的数据,就把这些数据放上去,百度开放云,我们已经训练了几个模型来预测精准的火车和货车的到达时间,预测未来仓储需求,未来运力需求,我们预测这些模型可以把中专时间降低50%,这会对物流有巨大的影响。
开放深度学习平台和百度大脑平台
你们都知道在百度,我们的继续学习已经对我们很多产品有很大的影响,其实我们内部最领先最好的机器学习平台就是我们的深度学习平台,我们最重要的产品和技术都是使用我们的深度学习能力。我们内部的深度学习平台获得这一类成功,我觉得主要有两个原因,第一,它易学易用,容易学习,容易用。第二,它性能高效,因为我们的深度学习平台的重点是易学易用,我们就有好几千个工程师,都可以比较容易的学习,而且使用我们的深度学习来影响各自的产品。因为在百度深度学习平台,对这么重要的产品有这么大的影响,我们在百都觉得深度学习平台是我们一个非常非常宝贵的资源。
我现在想送给大家第二件礼物,我非常高兴宣布这个月会把我们深度学习平台开放给大家。我刚才已经讲了我们深度学习平台的重点,就是易学易用,又性能高效。易学易用什么意思呢?给大家一个例子,我们就发现你如果想做各种各类的工作,左边写的那几个例子,你如果用一个主要的第三方平台,你的工程师就需要写几百行代码,你如果他使用这个工具,需要写的代码就减少了,而且我们也会提供有关深度学习的培训资料,希望这可以让你们开发者,让你们工程师更容易学习怎么样使用这种最领先的深度学习平台。
最后在百度也会尽力支持中国的开发者社区,我们的深度学习平台性能高效,支持做GPU工作,我做了深度学习做了很多年,使用比较多GPU可以得到更好的效果,如果大家想使用最有效的深度学习,希望大家去英伟达买很多GPU。
我们也支持分步训练,训练学习等等,希望我们的深度学习平台可以让你们的团队更容易,更有效的使用最领先的深度学习平台,来改变你们的工作。
我觉得采用人工智能最早的还是互联网公司,因为互联网公司有海量数据,也有非常好的工程师。不过我们已经看到,人工智能已经对科技公司和传统公司,已经有越来越大的影响。比如我刚才讲的智能音箱,我们的智能门锁,我们已经看到人工智能对很多传统行业或者说科技行业开始有越来越大的影响。
我刚才也说过,我对人工智能的未来充满信心,我刚才又给了四个例子,这四个例子也包括一个机器人医生。我觉得在人工智能时代,有的时候我们在台上讲人工智能的未来,未来那两个字在人工智能时代有时候很快就会到了,在百度还做了一个医疗大脑,我们只是研究阶段,探索一个机器人医生可以不可以做成功,你如果使用医疗大脑,你问他一个问题,你比如说问他感冒发烧了应该怎么办。这个医疗大脑就会理解你的问题,又问你很多有关状况的问题理解你的病情,你慢慢的回答他的问题,他也可以自动识别出你病情的可能,也可以为你提供一些有关病情的信息和提供一些建议。
这个医疗大脑当然不可以替代医生,而且如果患者想使用医疗大脑信息进行下一步,他当然需要先跟医生讨论,我是希望未来这一类工作,这一类技术可以为患者和医生提供有用的信息。
在百度我们这类医疗大脑和另外的工作,可以做的比较快,主要的原因就是我们的百度大脑技术和平台。你们都看得到在百度我们最重要的产品很多都是使用这些百度大脑技术做的成功,我们上个月的人工智能工作坊,也是一个月之内有70个团队,在一个月可以做到非常非常精彩的人工智能创新项目,他们可以做到的原因,就是他们可以选择最有效的人工智能技术部分,把它们融合做这一类工作。我觉得人工智能已经对百度有很大的影响,已经改变了我们的公司,这对你们有什么关系呢?我今天想带给大家的第三件礼物,就是我们从今天正式开放百度大脑平台,我希望这些技术可以帮助大家改变你的公司,改变你的行业。
在我们的百度大脑开放网站,已经写了我们技术能力,你们去这个网站也可以开始理解这些技术,你们怎么用,我们也会慢慢的把更多有关人工智能的培训资料放上去,放到这个网站,希望会对你们公司,你们传统有用,希望人工智能可以对你们的公司,你们的工作,有对我们一样大的改变。
今年百度世界大会的主题选的是AI is the new electricity,一百年前电力带来很大改变,今天人工智能也会对我们行业带来一样大的改变,我希望我们百度的人工智能技术可以帮助你们改变行业,改变社会,也希望我们可以协助你走进人工智能时代,谢谢大家。