猎云网11月11日报道 (编译:堆堆)
几个月前,为了能早一步看到一直以来为世人所期待的人工智能计算机,我长途跋涉来到位于纽约城约克城高地的IBM研究实验室。这里是Watson的研发地,这款人工智能计算机在2011年称霸智力竞赛节目《危险边缘》。初始版本的Watson也还在这里,它的体积大概有一个卧室那么大,周围有十台冰箱式机器竖直的放在它的旁边,就像是四堵墙。技术人员可以通过内部的小孔将电缆连到机器背部。Watson机器内的温度相当高,就像整个集群活过来了一样。
如今的Watson已经发生了天翻地覆的改变。它不再是只处于机器包围之中,事实上现在的它正通过大量对用户免费开放的服务器传播,并且能处理上百种人工智能收到的指令。和其他云端化的服务一样,Watson可以为世界各地的用户同时服务,用户可以通过使用手机、台式电脑或是他们自己的数据服务器来使用Watson。这一类的人工智能可以根据需求不同而增加或者减少。当使用人工智能的人多了,设计者就会更关注人工智能的改进,与此同时,Waston也就变得越来越聪明,在一种指令下学习到的东西可以立刻分享到其他的服务器中。它不单单是处理一个单独的程序,实际上Watson是各种软件引擎的集合。它的逻辑演绎引擎和语言解析引擎可以在不同的代码、芯片以及位置上运行——所有这些智慧的因素最后汇集成了一个统一的智能流。
用户可以直接连接到永久开启的智能产品,也可以通过那些使用人工智能云服务的第三方应用连接。跟许多高瞻远瞩的父母一样,IBM希望Watson走上医疗的道路。所以当IBM正打算利用人工智能开发一款医学诊断工具应用这一消息传出,大家并不感到吃惊。在此之前,开发者曾经多次尝试开发医疗诊断的人工智能产品,但是均以失败告终。不过,Wastson成功了。简单来说,当我输入一种我在印度感染患上的疾病症状,Watson会给我一份类似疾病的清单,依次按照患病的可能性排序。Watson给出的第一个病症,也是我最有可能的病症是Giardia(贾第鞭毛虫病)——这恰恰好就是正确的答案。这项技术还不能直接对病患开放,IBM将Watson人工智能提供给它的合伙人,帮助他们设计出用户用好型界面来进行预订医生和医院服务。创业公司Scanadu的首席医师Alan Greene在采访中表示:“我相信在未来类似于Watson的方式——不管是人还是机器——将会变成世界上最棒的诊断医师。”这家初创企业正是受到电影《星际迷航》中医用三录仪的启发,开始利用云人工智能技术制造一种诊疗设备。Alan Greene还表示:“随着人工智能技术的高速发展以及不断进步,现在出生的孩子长大后都无需去医院看医生来诊断病症了。”
随着人工智能的发展,我们必须设计出一些阻止其拥有人类意识的方法——我们宣传的最优质人工智能服务是基于无意识的。
医疗只是开始。所有大型的云服务公司以及众多初创企业,都争先恐后地推出了类似Watson的机器认知服务。数据分析公司Quid表示从2009年开始,人工智能就已经先后吸收了超过170亿美元的投资金额。光是去年一年,就有就有超过20亿美元投资给了拥有类似人工智能技术的322家公司。此外,Facebook还有Google也都在招募贤能之士,来组建各自公司内部的人工智能研究小组。Yahoo、Intel、Dropbox、LinkedIn、Pinterest和Twitter也都在去年收购了不同的人工智能公司。在过去四年的时间内,人工智能领域的私人投资以年平均增长率62%的速度增加,据估计,这样的增长速度还会继续保持强劲势头。
各行各业中人工智能产品的运用已经以雷霆之势闯入我们的视线。它不是和《2001太空漫游》中的HAL 9000一样拥有与人类一般的意识,也不是游戏《奇点》拥护者喜爱的超智能。未来出现的人工智能更像是一款价格低廉、可靠、工业化并且类似于网页版亚马逊的服务。这款电子智能默默地运行在所有活动的“幕后”,几乎不为人察觉,只有当它在偶尔闪烁几下的时候,你才能够注意到它。人工智能可以提供给你所需要的智能,并且不多不少。和其他设备一样,人工智能也会变得超级无聊,即便它对互联网、全球经济还有人类文明产生了深远的影响。它可以使得无生命的物体变活,就像一个世纪之前的电力一样。在电力发明之后,我们就开始认可所有电器的使用。而人工智能这种新设备也会改变每个人的生活(比如增强记忆力,加速认识能力)还有整个人类的生活。当今世界,利用智能,我们几乎可以将所有事物都变得新颖、不同而且有趣。事实上,由此我们都可以轻而易举的预测到接下来1万家初创企业的企业计划:选取一个事物然后添加人工智能。对于整个人类而言,人工智能可以改变我们的人生,而如今这项技术终于成熟了,新的时代就要到了。
在2002年我参加了Google的一个小型聚会,当然这次聚会还是在Google首次公开发行股票之前,那时Google还在专注于搜索领域的开发。我有幸和Google的联合创始人Larry Page交谈,Larry Page是一个非常杰出的联合创始人,在2011年他成为Google的首席执行官。我跟他说:“Larry,我始终不理解。现在网络上有那么多的搜索公司,可是你们为什么要做免费网页搜索?到底是什么促使你做出这个决定呢?”提出这个问题,事实上就已经表明了我那缺乏想象力的无知,正因为无知,所以才很难对未来做出预测。然而在我看来,在谷歌扩大其广告拍卖方案来获得实际收益时,甚至在Google在收购TouTube以及其他大宗收购时,我不是唯一一个一边狂热的使用Google的搜索网址的同时,一边认为这项免费的网页搜索引擎将“命不久矣”的人。然而Page的回答却让我大吃一惊,他说:“其实我们是在做人工智能。”
在过去几年内,Google收购了14家人工智能以及机器人公司,于是我对之前我和Larry Page的对话有了更深的理解。乍一看,你可能会觉得Google只是在增加它在人工智能上的投资组合,从而来提升搜索能力,毕竟80%的收益都来源于搜索技术。但是我认为这恰恰相反。Google并非是利用人工智能来改进搜索技术而是利用搜索技术在改进人工智能。每当你输入进一个问题时,轻轻点击一个相关的搜索链接,或者是在网页上创建一个连接,其实你都是在训练Google的人工智能。当你在搜索栏内输入“复活节兔子”,然后点击最像复活节兔子的图像时,你就是在教人工智能复活节兔子长什么样。Google每天拥有12亿搜索用户,一天内能产生1210亿次搜索,每一次搜索都是在一遍又一遍的辅导人工智能进行深度学习。随着这十年来人工智能算法的稳步改进,再加上较之以前已经增加了一千倍以上的数据、一百倍以上的计算资源,谷歌将会开发出一款无与伦比的人工智能:到2024年,Google的主打产品将不再是搜索引擎,而是人工智能。
毫无疑问,这样的观点将会引来很多人的怀疑。长达60年里,人工智能的研究员都做出了这样的预测:人工智能的时代就要来临。然而几年前,人工智能技术好像还遥不可及,人们甚至还创造出了一个术语拿来形容人工智能研究成果以及投入资金的匮乏,那就是:人工智能的寒冬。而如今,这一切发生了改变了吗?人工智能的时代真的来临了吗?
是的,最近技术上的三项突破使得人们盼望已久的人工智能时代终将来临。
1.低廉的并行运算
思考是一种人生来就有的并行过程,数十亿的神经元同时启动来创造出用于大脑皮层计算的同步电波。创建一个神经网络——即人工智能软件的主导结构——需要不同的计算进程同步进行。神经网络中的每一个节点都是大致模拟出人脑中的神经元,通过将计算结果传递给周边的节点来实现信号接收,相互作用。如果要理解一个口语单词,选择的人工智能成语就必须要分清彼此之间的所有音素;如果要分辨出一张图片,就必须要看清楚图片周围环境中的每一个像素。这两者都属于深层次的平行任务。但是就算是在如今人工智能快速发展的时代,标准的计算机处理器也只能够一次处理一项任务。
不过事情在十年前就发生了变化。一种叫做图像处理单元的新型芯片可以满足电子游戏中高密度的视觉以及并行需求。在此运行过程中,每秒都有上百万的像素被多次反复计算。这就需要一个专业化的并行计算芯片。将该芯片添加到电脑的主板中,作为对于并行计算的补充。当并行图片在游戏中起作用了,游戏也就会吸引更多的用户。到2005年,GPU芯片产量大幅度提高,随之芯片价格便降了下来。2009年,Andrew Ng以及斯坦福大学的一个研究小组意识到,GPU芯片可以并行运行于神经网络之中。
这一发现迎来了神经网络发展的新机遇,使得神经网络能够在节点之间容纳上亿个连接。传统的处理器需要几周时间才能够计算出拥有1亿节点的神经网络的级联可能性。而Andrew Ng发现在一个CPU集群可以在一天之内就完成这样庞大的计算。现如今,许多云计算公司都采用了CPU来运行神经元网络,比如说Facebook则利用这项技术来辨别照片中的朋友,Netflix则会利用该技术给5000万用户推荐靠谱的信息分享。
2.庞大的数据积累
每一种智能都需要经过教导的。人类的大脑即使天生就有给事物分类的能力,也仍需要后天的培育——即看过许多例子之后才能分辨出猫和狗的差别。人工智能也是如此。就算是拥有最高级的程序也需要在进行一千次国际象棋比赛后才能够掌握比赛规律,有良好表现。人工智能突破的部分原因在于对我们现处的这个世界收集到的大量数据,因为这些数据给人工智能提供了它们进步学习所需要的材料。大型数据库、自动跟踪、网页书签、上网历史记录、百万兆字节存储、数十年累积的搜索结果、维基百科以及整个数字世界都成了人工智能的老师,是它们让人工智能变得更加聪明。
3.优化的算法
在20世纪50年代,人类成功发明了电子神经元网络,然而隔了约数十年,计算机科学家才学会如何驾驭这种百万乃至亿个神经元之间庞大的组合关系,这样的天文数字让人想想都觉得可怕,更不要提处理神经元之间的关系了。而处理这个问题的关键在于将神经网络组织成为堆叠层。举一个比较简单的应用例子——人脸识别。当神经网络中的一组比特被辨别出来,这就形成了一个图像——比如说眼睛的图像——这个结果将会被传递到神经网络的上一层进行下一步分析。而下一个级别的分析则会将两只眼睛组合在一起,然后把有意义的数据块传递到等级结构的另一层,在那里将把眼睛与鼻子的图像结合在一起。辨别人脸的过程将需要数百万的节点(每一个节点都会产生出计算结果给周围节点使用),最后总共累积成15层。2006年,Geoff Hinton在多伦多大学对这项方法进行了一次重要改进,然后将这种方法命名为“深度学习”。他从数学层面上优化每一层的计算结果,这就在加速对叠层运算的同时加速学习进程。几年后,深度学习算法被移植到CPU中时,其运算速度又有了大幅度提升。仅仅是深度学习的代码是不足以进行如此复杂的逻辑推理,但是这是现有的所有人工智能产品的重要组成部分,包括IBM的Watsn,Google的搜索引擎还有Facebook的算法。
并行运算、庞大的数据、优化的算法,这三者组合成完美风暴促成了60年来人工智能的“一鸣惊人”。而这三者的结合也暗示了一个事实:只要技术发展的趋势仍继续,我们没有理由不相信人工智能不会精益求精,继续造福人类。
事实上,它也是这样做的。基于云应用的人工智能成为了我们日常生活中密不可分的一部分。但是好事可不会从天而降,往往人们也要为此付出一定的代价。云计算符合收益递增的规律,有时候这种规律也称之为网络效应,这就是说随着网络的发展壮大,网络价值也会以更快的速度随之增加。然而,网络越壮大,对于新用户的吸引力也就越强,这也就使得网络变得更大,吸引力更强,不断循环这样的过程。为人工服务的云技术也遵循这样的规律。越多的用户使用人工智能,人工智能就会变得越聪明;它变得越聪明,就会有更多的用户使用它;当越多的用户使用它,人工智能理所当然的就会变得更加聪明。所以一旦某一个公司进入到这样的良性循环,那么它必然将以更快的速度发展壮大,从而将所有的新兴企业甩到几十条街后。然而,这样问题就来了。人工智能的未来很有可能就由两到三种大型、多用途并基于云技术的商业智能产品统治。
1997年,Watson的前辈,也就是IBM的Deep Blue在一场著名的人机比赛中打败了当时的国际象棋大师Garry Kasparov。在之后的几场比赛中,电脑都取得了胜利,大部分人对这类比赛就已经失去兴趣了。也许你认为这就是故事的结局,实际上你可能只能猜中了开头。Garry Kasparov意识到如果他可以跟Deep Blue一样,能够立刻访问以前所有国际象棋比赛中的棋路,他就能够在和Deep Blue的比赛中表现得更好。如果这个数据库对于人工智能设备而言是公平的话,为什么人类不能够使用呢?为了践行这个想法,Kasparov首次提出了人加机器比赛的概念,在这类比赛中,人工智能机器将作为辅助工具帮助国际象棋棋手提高,而不是让人类棋手与之对弈。
如今被称为自由形式的国际象棋比赛更像是一种混合型的武术比赛。选手可以使用任何他们能想到的格斗技巧来比赛。你可以不借助外界帮助、只靠自己进行比赛,又或者你可以借助超级聪明的智能电脑来帮助你比赛。你要做的仅仅是按照它的建议移动棋盘上的棋子;又或者你可以成为一种电子人,即Kasparov提出的“半人半机”选手。电子人棋手会听取人工智能设备给出的建议,但是偶尔也会忽视这些建议——这和我们开车时候使用GPS导航系统一样。在2014年自由式国际象棋锦标赛中,参赛选手类型不限制,纯人工智能引擎赢了42场比赛,而电子人棋手则赢得了53场比赛。现如今,最优秀的国际象棋棋手就是电子人Intagrand,这是一个有几个人类加上几个不同国际象棋程序组合成的队伍。
但是最令人震惊的是:人工智能的出现并没有使得纯人类的国际象棋棋手水平下降。相反,廉价、超级智能的国际象棋程序吸引了越来越多的人下国际象棋。国际象棋的比赛也比之前举办的多了,棋手的水平也比以前高了。如今的国际大师人数要比Deep Blue首次战胜Kasparov要多两倍。当今顶尖的人类棋手Magnus Carlsen就曾通过人工智能进行训练,他被认为是所有人类国际象棋棋手中最接近电脑下棋水平的棋手,当然他也是一直以来排名最高的人类国际象棋大师。
如果人工智能帮助人类成为更优秀的国际象棋选手,那么我们就有理由相信它能够帮助人类成为更出色的飞行员、医生、法官或者是老师。大多数由人工智能完成的商业工作都应当是由具有特殊目的、有一定限制的软件完成,比如说将某种语言翻译成另外一种语言,但却不能翻译成其他语言。再比如说,它们可以开车但是却不能够与人交谈。又或者他们可以回忆起TouTube上每一个视频的每一帧像素,但是他们却不可以预测的日常工作。在未来十年内,99%的人工智能产品都将可以与人进行间接或者是直接的互动,它们都将是类似于书呆子一样的专心于工作、极度聪明的专家。
事实上,这不是真正的智能,或者应该说这不是我们所想要的智能。的确,智能也许是一种不利因素——尤其是我们用智能来形容我们所特有的自我意识、一切狂乱的自我反省还有混乱的自我意识流。我们希望无人驾驶的汽车能够不受干扰的在路上行驶,不要再纠结与车库之间的争吵。在我们医院的综合医生Watson也应该专注于它手头上的工作,而不该纠结于它是否应该专攻英语。随着人工智能技术的不断发展,我们应该想办法来遏制人工智能产生自己的意识——我们在宣传中指的优质服务应该是无意识的人工智能服务。
我们想要的不是智能,而是人工智慧。和普通意义上的智能不一样,智慧是一件更专注、可测量、非常具体的一个事物。人工智慧思考方式和人类形成认知的方法完全不一样。这里有一个关于非人类智能的小例子。今年三月在德克萨斯州奥斯汀举行的西南偏南音乐节,IBM研究员给Watson增加了一个由在线菜谱、美国农业部推行的营养表以及如何让食物更加美味的研究成果结合而成的菜肴数据库,这一做法让世人都惊呆了,大家从来没有想过人工智能还能这样使用。根据这些数据,Watson创造了很多新菜肴。而这些新菜肴则是依据如何让食物美味的研究成果、现有的一些美食菜谱,然后让人类大厨将这些菜肴做出来。Watson构造出来的最受欢迎的一道菜就是美味版本的炸鱼和炸薯条,这道菜是用酸橘汁腌鱼和油炸芭蕉制成。在约克城高地的IBM实验室里,我有幸品尝了这道菜,也吃了另一款由Watson创造出的美味菜肴:瑞士/泰式芦笋乳蛋饼。味道很棒,不过可以想象,没有人工智能的创造力,世人可能一辈子都无缘品尝到这些美味的菜肴。
非人类的智能不能算是错误,它不过是人工智能产品具备的一种特征。所有人工智能的主要特征就是他们不同于人类的智力——相异智能。这体现在很多方面:比如说某一个人工智能对于食物的思考就不同于任何一个大厨,这也使得我们可以用不同的角度看待食物。不单单是食物,还包括生产材料、衣物、金融衍生工具又或者是科学艺术的分支。而恰恰是这种相异性,给人类带来了更多的价值,而这些价值绝不仅限于人工智能的速度或者是力量。
事实上,它所做的正是帮助我们更好地理解智能这个概念。在过去,我们通常认为只有那种超级聪明的人工智能才能开车或者在《危险边缘》这个节目里称霸甚至是在国际象棋大赛中战胜人类。但是一旦人工智能在以上比赛或者节目中战胜了人类,我们就会认为这些成就呆板,并且根本称不上是真正的智能。事实上,每一次人工智能获得的成功都将重新赋予它自己新的定义。
不过一直以来,我们不但是在重新定义我们所理解的人工智能,也在重新定义人类自身存在的意义。过去的六十年里,机械加工不断复制了人类特有的行为和才能,这就使得我们开始深思我们进行机械加工的初衷,是什么将我们和机器区分开来。随着我们开发出越来越多的人工智能,我们将不得不放弃很多人类特有的特点。在未来十年,或者可以说是在下个世纪,我们将遭遇一场空前持久的身份危机,我们不得不扪心自问人类存在的意义。不过最值得讽刺的是,我们每日接触到的实用人工智能产品带来的最大益处并不是社会生产力的增加,经济的蓬勃发展或者是科学技术的突破,尽管这些很有可能会发生。人工智能的到来带来了很多益处,其中最重要的莫过于人工智能的出现帮助我们定义了人类存在的意义。我们需要人工智能告诉我们——我们究竟是谁。
遍布世界各地的人工智能产品
在过去五年里,低廉的运算、新颖的算法还有大量的数据形成了众多基于人工智能的服务,而这些服务之前本都处于构想或者是仅仅是纸上谈兵的状态。
谷歌无人驾驶汽车:Google最初的目标是为整个网络编写索引,而如今,它希望为现实编写索引——因此它开始着手于完善无人驾驶汽车。在汽车根据给定的某一个路线行驶前,Google司机将会扫描整体路线,然后给出一个最准确的地图。这类无人驾驶汽车仅仅是利用其车顶部的激光、摄像头、雷达系统来检测周边环境中任何不同寻常的事情就可以选择出一条最合适的路线。这无疑比建立一个全世界的实时地图要方便得多。
Body Tracker(身体追踪器):为了让用户通过操控自己的身体来进行游戏,Microsoft的Xbox项目的研究员Kinect不得不采取一种全新的机器学习的技术。首先,这个设备内部的红外发射器以及传感器会创建出用户形体的整体框架3D图,并且还会对用户身体不同的几个部分进行分析,包括肩膀、脚还有手。然后运用一种叫做决定预测的方法,Kinect的人工智能系统就可以预测到用户身体下一步最有可能做出的动作。这个系统相当于对你的动作进行实时监测,此外,该系统也不会对XBOX的记忆卡造成任何损伤。
Personal Photo Archivist(个人照片档案): Matt Zeiler的设计目的是希望用户找到一张照片就像在手机通讯录中找到一个联系人一样简单。他刚刚成立的公司Clarifai正在推出一款全新的搜索技术,在用户的手机上对照片编索引。当过时的图片搜索应用还在通过色彩、线条来寻找照片的时候,Clarifai的人工智能应用已经理解了照片中的对角和平行线条存在的意义,据此当他们研究了越来越多的图片时,他们也就掌握了更高级别的概念。
Universal Translator(通用翻译器):Skype的这款翻译工具首次亮相于年末的测试版,它能够实时进行翻译,可以让不同语言的所有人自然进行交谈而不需要译员在一旁翻译。这款人工智能软件在推出之前进行了百万次翻译句子的练习,最终可以猜测出一堆混乱的词语组成的意思。至于声音识别,Skype分解了声音的样本,不断进行分析,最终使得人工智能产品能够很好地理解不同的发声方式形成的语言。
Smarter News Feed(智能信息流):Facebook雇佣了世界上最有名的深度学习专家Yann LeCun,并在去年组建了一个人工智能实验室。Yann LeCun的任务是改进社交网络的声音、图像辨别软件,使之能够更有效率的在视频中找到你想要看到的好玩的照片,比如说你的朋友在某一个聚会中的照片。
Source:Wired