8月28日,人工智能软件公司商汤集团股份有限公司(下称:商汤) 公布截至2023年6月30日止六个月(下称:期内)的中期业绩。
期内,商汤营业收入14.3亿元,同比增幅1.3%;毛利率45.3%;亏损净额按年收窄2.0%至31.4亿元,经调整亏损净额按年收窄6.7%至23.9亿元,总资金储备为148.2亿元。
国际市场方面,商汤持续拓展海外业务,上半年收入为2.3亿元,收入贡献比例为16.0%,较2022持平。
值得一提的是,期内,商汤生成式AI相关收入取得了670.4%同比增长,对集团业务的贡献迅速提升至20.3%。
据悉,商汤联合多家国内顶尖科研机构发布了预训练大语言模型InternLM,成为国内首个超越GPT-3.5-turbo性能的基模型。
基于“日日新”大模型系列与商汤AI大装置SenseCore,商汤于4月发布生成式AI产品系列,包括商量、秒画、如影、琼宇、格物,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的生成式AI应用。
大语言模型
商汤联合多家国内顶尖科研机构,共投入约10000张GPU在大语言模型的研发上,使其能力实现飞跃式发展:
4月推出商量SenseChat1.0,是国内最早推出基于千亿参数大语言模型的聊天机器人产品之一;
6月发布首个综合能力超越GPT-3.5-turbo的基模型InternLM,参数量1040亿,使用1.6万亿token的多语言语料训练,支持语言达20多种,并在此基础上于7月初发布了商量SenseChat2.0;
8月新模型InternLM-123B完成训练,在全球51个知名评测集(包括MMLU, AGIEval, ARC, CEval, Race, GSM8K等)共计30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B等模型;在此基础上商量SenseChat将在9月升级到3.0版本;
原始语料数据的积累以及对语料进行清洗和试验的能力行业领先,目前每月产出约2万亿token的高质量数据,预计年底高质量数据储备将突破10万亿token,以支持更加强大的基模型的训练;
支持开源平台建设,InternLM-7B(70亿参数)的部分训练数据、训练代码及基模型权重已经向学术界及工业界免费开源,并支持商用;InternLM-7B在多个模型测试榜单高踞榜首,成为性能最好的轻量级基模型。
文生图模型
商汤投入了约2000张GPU在文生图模型的研发上,实现了文生图能力的快速迭代:
1月,秒画1.0搭载商汤自研8亿参数扩散模型开启内测,用户可以输入提示词生成二次元图片;
4月,秒画升级2.0并正式对外发布,是集团首款基于14亿参数文生图模型打造的C端应用,打造通用领域的基础模型;
7月,秒画升级3.0,基模型参数量提升至70亿参数,并采用全新的生成模型架构,带来更好的图片生成效果和精细度,实现专业摄影级的图片细节刻画。秒画3.0核心算法在COCO benchmark上超过了谷歌的Imagen与OpenAI的DALL·E 2,出图效果跻身全球前列,国内领先;
秒画4.0预计在2023年三季度内推出,基模型升级的同时也将引入全新的美学系统支持。
商汤也为智慧商业、智慧生活、智能汽车和智慧城市四大板块的客户,在第一时间提供了这些新能力,让客户可以快速迭代基于大模型的新产品。
在智慧商业板块,商汤与十个行业的数百家客户合作,定制行业大模型,单客户收入实现59.9%增长;智慧生活的手机和移动互联网客户上半年围绕生成式AI创新活跃,客户数重新恢复增长;智能汽车量产业务实现5.7倍同比增长,量产交付数量达到39万台车,量产带动的规模效应使得单车毛利提高29%,研发收入下降,量产收入占比快速提高;智慧城市保持有序收缩,聚焦精品项目,优化现金流。
商汤集团董事会执行主席兼首席执行官徐立博士表示:“在这个半年度,大模型和生成式AI可以说是全球最受瞩目的科技突破。商汤迎来了极其关键的发展时期。我们的“日日新“大模型体系”和AI大装置SenseCore带来了非常亮眼的表现,我们抓住技术突破带来的新机遇,成功发布了国内第一个综合能力超越GPT-3.5-turbo的大语言模型,让我们生成式AI相关收入实现了670.4%的增长。我们希望给行业带来更强的大模型能力,助力我们的用户在生成式AI的时代做出颠覆性的产品,来获得成功。”