来源:猎云精选,文/王非
十年剧变!
自2013年Deepmind开启AGI的实现道路之后,Narrow AI(弱人工智能)一直是AI的代言人。
进入2023年,ChatGPT爆火后,我们讨论的AI慢慢变为了AGI(通用人工智能)。
数据、算法、算力自始至终是AI的三大支柱,而以“大数据+大算力+强算法”支撑的大模型,也吸引着国内外巨头以及创业公司前赴后继。
放眼国内互联网大厂,百度“文心”、华为“盘古”、腾讯“混元”、阿里“通义千问”、商汤“日日新”、昆仑万维“天工”等大模型,带着浓厚的中国文化色彩,密集涌现。
其中,BAT无需多言,天然自成“体系”。商汤则凭借“多年来一直积极投入建设超大规模的算力,也一直训练越来越大的模型”,得以与巨头比肩。
4月10日,商汤刚刚在技术交流日上,正式公布了“日日新SenseNova”大模型体系,并公布了其依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。
基于此,商汤也得以在AGI时代的开端,抢先开启MaaS(Model as a Service,模型即服务)模式,面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种服务。
大模型“诸神之战”已然开启,MaaS模式下的千行百业争夺,也成为这场比拼的一大焦点。
建造开发“大装置+大模型”,长期坚定底层技术研发投入
作为一家成立于2014年的AI公司,商汤在AI领域已储备多年。
在AI大基础设施上,商汤于2020年启动建设亚洲最大的人工智能计算中心AIDC,并在2022年1月启用。
在2021世界人工智能大会期间,商汤正式推出新型AI基础设施——SenseCore商汤AI大装置;2022年9月,商汤大装置AI云也对外发布,并于今年2月25日正式上线。
2022年,商汤SenseCore AI大装置持续扩建,完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力,目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。
自成立之初不断打磨至今天,商汤建设了业界领先的AI大装置,拥有亚洲目前最大的智能计算平台之一。
而在大模型上,商汤自2018年开启研发,也已深耕超五年。
2019年,商汤就首次发布了10亿参数的视觉大模型。
2021年11月,商汤联合上海人工智能实验室、清华大学、香港中文大学、上海交通大学共同发布“书生”大模型,并持续联合研发。今年3月14日,商汤也刚刚发布多模态多任务通用大模型“书生(INTERN)2.5”,其拥有30亿参数,是目前全球开源模型中ImageNet准确度最高、规模最大,同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型。
2022年,商汤还成功研发了320亿参数量的全球最大的通用视觉模型,在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。
多年的大装置建造,加上大模型开发,离不开商汤在研发上持续不断的投入:2018年至今,商汤累计研发投入达128.47亿元。
3月28日,商汤公布的2022年财报显示,研发人效相比去年进一步提高90%,人均每年研发模型数9.35个;累计商用模型数提高了93%至6.7万个。
在财报发布时,商汤科技董事会执行主席兼CEO徐立博士总结到:“2022年,通用人工智能(AGI)领域在大算力与大模型的驱动下取得了显著进展。商汤始终以前瞻性的眼光,专注于超大模型的研发,并积极投资建设人工智能高性能计算基础设施。面向未来,我们将通用人工智能(AGI)作为核心发展战略,以期在未来几年内实现重大突破。”
不止语言大模型“商量”,商汤造了个“大模型超市”
商汤“突破”的第一步,正是4月10日重磅亮相的“日日新SenseNova”大模型体系,并同步推出了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
徐立表示:“我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”
正如百度的“文心一言”,360版GPT(被网友戏称为“红孩儿”),商汤基于“日日新SenseNova”,推出了其最新研发的语言大模型“商量SenseChat”,Slogan为“商量商量,都能解决”。
作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。
在4月10日的技术交流日活动现场,“商量SenseChat”展示了出色的多轮对话和超长文本的理解能力。此外,商汤还展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。
不止于“商量SenseChat”,商汤还展示了“日日新SenseNova”的各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用:
“秒画SenseMirage”文生图创作平台,展现了光影真实、细节丰富、风格多变的强大的文生图能力,可支持6K高清图的生成;客户还可根据自身需求训练生成模型。
“如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
其中秒画作为AIGC文生图方向的创作平台,备受市场关注。据了解,商汤“秒画SenseMirage”是一个包含商汤自研AIGC大模型和便捷的LoRA训练能力,并提供第三方社区开源模型加速推理的创作平台,旨在为创作者提供更加便利、完善的内容生产创作工具。秒画“SenseMirage”不仅融合了超10亿参数的商汤自研文生图生成模型,还支持一键导入多个平台的开源模型或上传用户本地模型并对其进行特异性推理加速优化,结合自研模型及训练能力,用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。
徐立认为,“日日新SenseNova”带来的这些强大而易用的内容生成能力,将会改变内容生产行业的生产范式,突破内容创意的天花板,将会重塑内容生产行业生态并打开新的增长空间。
而这也与阿里张勇,“面向AI时代,所有产品都值得用大模型重新升级”的观点不谋而合。
徐立表示,“我们在起到‘日日新’这个名字的时候,大家反映它很像是一个超市。寓意也不错,商汤提供一个大模型的超市。我们的‘日日新SenseNova’大模型超市里面,有数据、模型训练以及部署的三位一体的飞轮,能够完成自然语言的生成工具、图片生成的服务工具,所有的感知类任务的工具,以及模型的增量研发、服务工具。我们以此来作为上下游合作的基础,也欢迎合作伙伴来接入我们的‘日日新SenseNova’大模型体系,一起迭代下一个阶段的大模型。”
模型即服务全面“开放”,MaaS模式已成趋势
对内而言,“日日新SenseNova”已为商汤的自身业务带来了诸多突破。例如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。
然而,AI的潜力不能仅靠一家公司挖掘,需要千行百业共同探索。
深谙于此的商汤,早在2022年就已全面布局生成类预训练大模型,围绕文本、语音、图像、视频、3D场景的内容生成形成完整能力,整体升级了SenseMARS混合现实平台的产品及功能,面向行业客户服务并带来收入增长。
据了解,SenseMARS的AIGC相关能力赋能小红书、微博、bilibili、ZEPETO、Line等APP应用超过200个,头部客户续约率超过95%。所拓展的线下场景覆盖面积增加至1500万平方米,覆盖大型游乐园区、大型商场、博物馆、银行等多个顶流场景。
于是在最新发布“日日新SenseNova”时,商汤也继续强调“开放、共赢”。
据介绍,“日日新SenseNova”已为政企客户提供了多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
商汤希望,基于其AI大装置SenseCore和“日日新SenseNova”大模型体系,面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务(Model-as-a-Service):
基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。
大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型,包括在预训练大模型之上进行垂域行业模型的开发,生产千行千面的自定义模型。
模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。
商汤也向行业开发人员开放大量预训练模型及AI开发工具链,全面赋能客户提升开发效率。
正如国泰君安证券在最新研报中所言,基础大模型日趋成熟,MaaS已成产业趋势。
对此,徐立也充满期待:“在大模型时代,AI可以更好地赋能百业。很多人讲AGI时代已经来了,至少我们认为AI大模型会带来新的生产范式,将会为我们带来无限的可能性,这件事情是无比让人兴奋的,我们也会将AGI作为核心的发展目标,在未来几年持续推动大模型和AGI技术的突破。”