【猎云网(微信:ilieyun)北京】3月29日报道
3月29日,阿里云在云栖大会·深圳峰会上发布ET医疗大脑和ET工业大脑,同期发布的还有用可视化的拖拽方式让开发者使用人工智能技术的机器学习平台PAI2.0。会上的主持由阿里的ET机器人担任。
阿里云首席科学家周靖人现场发表了对于人工智能方面的看法。他表示,人工智能的开发面临技术门槛高和需要大量的数据计算问题。而阿里云的学习平台PAI就解决了这个问题。提供海量的存储和计算的能力。
此次阿里云机器学习平台PAI2.0的升级包括丰富的算法、文本分析等。另外,还提供了强大的计算资源,包括CPU、GPU、FPGA,可以根据自己的需求选择合适的硬件,根据每个人工智能的需求,自动地优化、选型,在不同的硬件上得到最优的效果。
除此之外,周靖人提到,他们还对其他数据可视化的功能,包括对数据分布的展示,包括对最后产生模型的评估结构的展现。一系列可视化的功能帮助大家很快地观察整个训练的过程中的一些效果。
以下为周靖人演讲全文:
大家好,毫无疑问,现在人工智能在城市治理、交通调度、工业制造、健康医疗等领域都得到了长足的应用。毫不夸张地讲,今天人工智能已经迎来了新的浪潮。在人工智能应用的背后都需要有一个强大的、完善的人工智能机器学习的开发平台。
人工智能的开发面临很多挑战。首先,技术门槛很高,需要开发者对人工智能的理论、机器学习的算法有了解,还需要对分布式的系统,以及硬件有深度的了解。同时,我们也需要有大量的数据计算,随着算法的模型越来越复杂,这样的计算需要大量的计算资源,从而也需要我们对背后的计算资源有弹性的管理。阿里云的学习平台PAI就解决了这个问题。我们提供海量的存储和计算的能力,同时我们也提供各种工具以及各种算法库,方便开发者搭建数据库。
在2015年,我们推出了PAI的1.0版本,我们回顾一下,包括数据处理以及基础的回归、分类、聚类算法。今天,我们在这里宣布阿里云机器学习平台PAI2.0的升级。这次的升级包括了丰富的算法,除数据预处理、特征选择外,还包括文本分析,离线训练、在线预测完美结合。在深度学习方面,我们支持TensorFlow 、CAFFE、MXNET框架,这些框架与开源接口保持高度兼容。开发者可以根据自己的喜好选择最合适的人工智能的开发框架,这一系列系统搭接在飞天的分布式系统上,可以帮助大家最好地实现人工智能的应用。同时我们也支持各种数据源,包括非结构化、结构化的数据云,提供一站式的服务。
另外,在大量数据的背后,我们提供了强大的计算资源,包括CPU、GPU、FPGA,可以根据自己的需求选择合适的硬件,根据每个人工智能的需求,自动地优化、选型,在不同的硬件上得到最优的效果。
同时,我们的机器学习平台支持超大规模的训练,首先支持PB级的数据,可以分析PB级大量的数据,也支持千亿的特征,可以训练万亿级的样本,大家有数据上的需求和挑战,都能帮助开发者解决问题。
在人工智能整个开发过程中有一个流程,比如说我们最开始进行离线的训练,运用大量的数据训练一个模型,这个模型会进行在线的预测。这个过程在我们的PAI平台上可以做到一体化,可以做到平滑地迁移,系统帮助开发者在训练完的模型后进行模型的部署,以后完成最后的在线预测。比如说在我们的城市大脑这个项目里,我们一方面可以训练视频方面的模型,可以完整、平滑地把模型发布到云端,进行实时的视频分析,监测出每一辆车的出行方向。
一个完整的机器学习平台离不开图像化的界面,我们举个例子,我们可以通过拖拽的方式搭建一个算法实验,通过设计数据源、模型等参数,让系统进行人工智能的训练。在整个训练的过程,我们还可以很快地通过可视化的方式,在每个迭代的时候算法的准确率,而且通过其他可视化的功能,我们对神经网络训练过程的每一卷层特征数据也可以有非常清楚的了解。
除此之外,我们还对其他数据可视化的功能,包括对数据分布的展示,包括对最后产生模型的评估结构的展现。一系列可视化的功能帮助大家很快地观察整个训练的过程中的一些效果。
这套系统经过了多年的磨炼,一方面支撑了阿里集团内的各项业务,同时也为阿里云很多人工智能项目里提供了坚实的平台支持。我们很高兴看到,越来越多公共云的用户开始使用我们PAI的平台开发各自的数据应用。我希望大家更多地参与到PAI平台的开发,大家发现这样的平台更有利于大家人工智能上的突破,我们也愿意跟在座各位开发者一起,突破人工智能在各行各业的发展。
谢谢大家。