【猎云网(微信:ilieyun)北京】4月17日报道
4月16日,北京智源人工智能研究院与旷视启动“智源学者计划”,双方共同成立联合实验室。
北京智源人工智能研究院是在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区人民政府推动成立,依托北京大学、清华大学、中国科学院、旷视等北京人工智能领域优势单位共建的新型研发机构。
北京智源人工智能研究院副院长刘江介绍,自2018年11月成立以来,北京智源人工智能研究院按照《北京市支持建设世界一流新型研发机构实施办法(试行)》精神,积极探索新型科研管理等机制体制创新,贯彻国家新一代人工智能发展规划总体部署,实施“智源学者计划”,支持科学家勇闯人工智能科技前沿“无人区”,同时与北京优势高校院所和骨干企业共建联合实验室,开展跨学科、大协同的创新攻关,引领未来人工智能基础研究方向。
北京市科委副主任张光连在讲话中指出,北京市科委在2018和2019年两年给予智源研究院共计3.4亿元的资金支持,海淀区在办公空间、人才政策等方面提供了服务保障,今后还将支持智源研究院积极争取国家科技部等部门支持,承接国家科技创新2030—“新一代人工智能”重大项目等任务。今年,北京将开放一批人工智能应用场景,推动人工智能新技术、新产品、新模式在北京率先运用,促进人工智能和实体经济深度融合。同时,还将成立智源人工智能产业培育基金,超前布局,分担企业创新风险,积极培育一批国际领先的人工智能企业。
智源学者计划发布,着力培养国际影响力的青年学术英才
据北京智源人工智能研究院院长黄铁军介绍,此次发布的“智源学者计划”,是智源研究院打造高层次基础研究人才队伍的引领性工程,旨在面向当前和未来人工智能创新发展,选拔并培养一批德才兼备、具有国际影响力的学科领军人才和具有发展潜力的青年学术英才,构建富有创新能力、梯队合理的人工智能基础研究创新团队,建立面向未来人工智能发展的高端人才储备,引领未来人工智能基础研究方向,推动北京人工智能产业创新发展。
“智源学者计划”为从事人工智能基础研究的科学家营造了良好的科研环境,给予科学家充分的尊重和信任,将技术路线决策权和人财物支配权全部交于科学家,试点科技经费“包干制”,使科学家可以心无旁骛、潜心研究、创新突破。“‘智源学者计划’的目标,就是要找到最好的人,给他自由支配的经费,提供他需要的资源,支持开展人工智能领域特定方向上的重大基础问题研究,或者开展前沿问题的自由探索。”黄铁军说。
具体来说,“智源学者计划”将依托北京大学、清华大学、中科院等优势高校院所,以及旷视等骨干企业研究院,对四类人才进行重点支持,分别是:智源科学家首席(CS)、智源研究项目经理(PM)、智源研究员(PI)和智源青年科学家。其中,智源首席科学家(CS)由领域内顶尖专家学者担任,负责研究方向的整体规划布局,并推荐智源研究员(PI)人选;智源研究项目经理(PM)则兼备技术和管理才能,协助CS管理项目,并负责多方沟通;智源研究员(PI)是所属研究领域的领军人才,开展确定领域的科研活动;智源青年科学家是38岁以下拥有博士学位、在科研上具有无限发展潜力的青年学者,并在智源研究院对支持下开展开放性、探索性研究,勇闯人工智能科技前沿“无人区”,面向未来人工智能新思维和新体系的发展提出引领性的原创基础研究成果。
目前,经过提名、初评、审议等流程,已经遴选出首批智源学者共21人,并即将启动公示程序。其中,首批智源学者“人工智能数理基础”重大研究方向首席科学家(CS)由中国科学院院士、北京大学数学科学学院张平文教授担任,智源研究项目经理(PM)由北京大学夏壁灿教授担任,智源研究员(PI)候选人由来自北京大学、清华大学、中国科学院的10名杰出中青年学者。首批“智源青年科学家”候选人共9人,其中“人工智能数理基础”5人,“机器学习”方向4名,分布来自北大、清华、北京应用物理与计算数学研究所和旷视。其中,入选首批“智源青年科学家”候选人的旷视研究院研发总监张祥雨博士仅28岁,也是首批智源学者候选人中年龄最小的一位。
按照计划,首批智源学者将致力于打破基于计算机实验和神经科学的人工智能的惯用建模范式,以可解释性的新型人工智能模型、新型的机器学习算法、深度学习的基础研究为研究内容,解决人工智能面临的可计算性、可解释性、泛化性、稳定性等基础理论问题,建立以数学与统计理论为第一原理的新一代人工智能方法论。
黄铁军表示,今年将计划遴选智源学者100人,其中青年科学家30-50人。2020年和2021年再分别增加100人,智源学者总体规模保持在300人左右。
智源与旷视共建联合实验室,建设一体化开放创新平台
会上海淀区委常委、副区长李俊杰、旷视首席科学家孙剑教授共同为“北京智源 - 旷视智能模型设计与图像感知联合实验室”揭牌。该联合实验室拟由旷视首席科学家兼旷视研究院院长孙剑任实验室主任,研究员周舒畅任实验室副主任。
“目前有大量的高校、研究院所、创新创业人员和行业客户,想参与到人工智能创新中,但苦于没有数据,算力或算法等资源,无法施展。”在发布会现场,孙剑一针见血指出了当前人工智能行业创新所面临的问题。
2017年7月,国务院发布《新一代人工智能发展规划》,人工智能上升为国家战略。建立开源开放的人工智能开放创新平台,服务企业应用技术开发成为当前该领域的难点。国家也希望龙头企业通过打造人工智能开源开放创新平台,调动产学研,社会各类创新创业主体参与共同打造我国自主知识产权的产业生态,提升国际影响力,促进行业整体发展。
同时,北京市作为第一个国家新一代人工智能创新发展试验区,也希望能够充分调动北京技术、人才方面优势,通过组织机制创新,依托龙头企业牵引进行多主体协同创新,打造我国乃至全球技术高地。
“北京智源 - 旷视智能模型设计与图像感知联合实验室”也因此孕育而生。孙剑表示,旷视与智源通过联手打造数据集和建设联合实验室,来推动整个行业协同创新发展,建设共性技术开放创新平台,构建自主可控产业生态。
据孙剑介绍,“北京智源 - 旷视智能模型设计与图像感知联合实验室”将基于旷视在计算机视觉技术和应用的深厚积累,通过3年时间,建设一体化的数据共享、模型设计与场景测试的开放创新平台,突破大数据背景下模型架构设计、优化和部署等技术,探索突破视觉系统性能极限和模型设计及场景测试的自动化,推进大数据背景下模型架构设计、优化和部署等方面的研究。
数据方面,实验室将立足旷视算法落地场景丰富、数据积累深厚的优势,以开源数据集、预抽取特征等形式,持续开放通用物体分类、物体检测追踪、人像人形识别属性等视觉问题数据,助力相关领域研究。针对高搜索效率、高准确率、高灵活性等关键指标,该实验室还将开展支持大计算量模型的新神经网络架构搜索算法(NAS)研究,构建一站式深度模型自动化设计平台等工作。
模型设计优化方面,平台将提供自动化模型搜索、错误分析与可视化工具,加速大模型架构探索和优化,降低面向应用的模型设计门槛,来解决传统模型架构人工设计方法的经验性强,迭代周期长的问题。同时,实验室还将积极探索低位宽神经网络相关技术,研究实现对于大计算量模型的云上和终端两级的硬件支持,完成从模型搜索到实际应用的垂直整合。
场景验证方面,实验室将通过建设人脸抓拍识别、结构化检测、大规模人像比对等验证场景和提供自动分析报告服务,为研究算法调优提供环境,并积极探索低位宽等网络压缩技术,研发高效硬件部署方案,推动模型研究成果迅速投入实用。针对计算机视觉算法与真实场景适配的问题,实验室还将建设可重现的实景测试环境,并提供自动化的量化错误分析报告,帮助算法迭代。
孙剑表示,实验室平台建成后,将面向高校院所、创业企业等创新创业主体开放,致力推动图像感知与计算领域的协同创新。“通过以上措施,实验室将被打造成为一个开放、贴近实际场景的计算机视觉算法研究实验平台,形成涵盖数据、平台、场景的完整闭环,有利于打造我国自主可控的技术和产业生态,共同助力我国图像感知和计算领域的技术及应用达到国际先进水平。”
北京智源人工智能研究副院长唐杰表示,北京智源联合实验室是智源研究院面向人工智能未来发展,围绕重大应用需求,联合各大高校、科研院所、优势企业等机构进行全方位科研合作的平台。其目标是高效整合大学、科研院所、企业的数据、平台、场景等优势资源,形成具有国际领先水平的人工智能研究团队,培育国际顶尖AI人才,推动人工智能产学研协同创新发展,产出系列国际领先水平的突破性成果,并将重点组织数据共享,支持算法开源,推动场景开放,实施协同创新。智源联合实验室分为两类,分别是与高校院所共建、与优势企业共建。共建单位将提供配套资金、场地、设备等条件保障,解决实验室建设与运行中的有关问题。
在联合实验室的建设上,智源研究院遵循“成熟一个、启动一个”的原则,择优支持共建,最多可连续支持三年。唐杰强调,“北京智源 - 旷视智能模型设计与图像感知联合实验室” 已通过立项论证,也是智源联合实验室首个成功落地的项目。
全球最大的物体检测数据集发布,首批开放超过60万张图像和1000万标注框
会上,旷视研究院联合北京智源人工智能研究院发布全球最大的物体检测数据集——Objects365。旷视研究院院长孙剑说,该数据集也是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。
规模方面,Objects365定义了生活中常见的365个类别,第一批将开放63万张图像,1000万的标注框。开放图片数是COCO的5倍,标注框超过COCO的11倍。
算法优化的上限严重依赖于基准数据集术的质量。为保证标注质量,在打造Objects365时,旷视设计出一套科学而严格的标注流程,每一张图片的背后至少会经过9名标注工人之手。
此外,作为一个优秀的预训练数据集,Objects365预训练模型在使用过程中,可以轻松超越现有算法的精度,显著加速收敛过程,表现出极强的泛化能力。在执行COCO、VOO Det、CityPersons等检测任务时,在VOC Seg和ADE等分割任务上均有显著提升。
DIW2019挑战赛即将启动,共同探讨检测问题的瓶颈及优化方向
Detection In the Wild 2019(DIW 2019)挑战赛也发布会当天正式启动。据孙剑介绍,该挑战赛是基于2019年CVPR的研讨会,由旷视联合北京智源人工智能研究院举办,其目的是为了推动目标检测技术的发展,改善现有目标检测数据集的类别覆盖不全、标注精度不高、密集场景缺少等问题。挑战赛于5月10日开放测试集,6月10日结果提交截止,6月10日公布比赛结果,并邀请优胜队介绍比赛经验。主办方为每个赛道的冠军队伍准备了10000美元的奖励届时,优胜队将在CVPR现场的研讨会上介绍经验,共同探讨检测问题的瓶颈及优化方向。
DIW2019挑战赛的比赛赛道分为三个赛道,即Objects365赛道、Objects365小赛道和CrowdHuman赛道。
其中,为探索目标检测系统的瓶颈,参加Objects365赛道的选手将利用公开的365种类别,60万张图片超过1000万个框的完整训练集对检测模型进行训练;在3万张图片构成的验证集上调试算法,并在10万张图片构成的测试集上进行最终的挑战。
为了降低参赛门槛,加快算法迭代速度,研究长尾类别检测问题,Objects365小赛道则从Objects365数据集中挑选出65个类别,选手可以用1万张图片进行模型的训练。
CrowdHuman赛道则是为了解决现实生活中的遮挡问题,其算法的提升将会推动人体检测算法落地。届时,选手将基于专门为了密集场景人体检测设计的CrowdHuman数据集进行训练,数据集包含有丰富标注信息和多种场景。