来源:AI星球,文/王非
一年时间,AI从iPhone时刻,来到了变革时刻。
当地时间3月18日下午(北京时间3月19日凌晨4点),英伟达CEO黄仁勋发表“见证AI的变革时刻”的主题演讲,发布了全新AI芯片架构Blackwell,基于该架构的首款GPU产品B200。
基于此,英伟达提供了GB200、DGX GB200 NVL 72、DGX SuperPOD超算平台等“组合产品”。
硬件产品之外,英伟达还发布了创造营收的新产品——集成AI开发软件微服务系统NIM,用以帮助企业快捷部署公司级专有模型。
此外,英伟达还推出了GR00T人型机器人项目——人型机器人基础模型,支持通过语言、视频和人类演示,为人形机器人生成行动指令。
值得一提的是,在回顾完英伟达发展历史,正式发布新产品之前,黄仁勋通过一个短片向外界展示了“英伟达的灵魂”,该片是“世界上第一场一切都是(AI)自制的音乐会”。
“God,I love NVIDIA !”观看完毕,黄仁勋忍不住赞叹。
黄仁勋如此激动兴奋,在于大模型时代,英伟达自身“卖铲人”的定位,使得该公司2024财年营收609.22亿美元,同比增长126%,净利润297.60亿美元,同比增长581%。而这,更是助推其股价在一年来翻了近两倍。
新架构新产品,更快更强
作为英伟达GTC大会的重磅环节,黄仁勋宣布推出新一代GPU Blackwell(致敬统计学家兼数学家大卫·哈罗德·布莱克威尔),“Hopper(致敬格蕾丝·赫柏)固然已经非常出色了,但我们需要更强大的GPU”。
黄仁勋表示,8年时间,AI算力已增长1000倍。他认为,“加速计算到达了临界点,通用计算已经过时了。我们需要另一种方式来进行计算,这样我们才能够继续扩展,这样我们才能够继续降低计算成本,这样我们才能够继续进行越来越多的计算。”
据黄仁勋介绍,许多组织预计将采用Blackwell,如亚马逊网络服务、戴尔、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉、XAI。
在Blackwell的支撑下,黄仁勋再次为英伟达升级了“核武库”。
当下4 nm制程工艺仍处于瓶颈期,于是英伟达将两个芯片拼接,通过10 TB/秒的带宽互联,组合而成包含2080亿晶体管的B200 GPU,将于今年晚些时候上市。单GPU AI性能达20 PFLOPS(即每秒2万万亿次),前代H100仅为4 PFLOPS。B200的内存192 GB,基于第五代NVLink,带宽达到8 TB/s。
黄仁勋展示两款GPU,左为新款Blackwell架构B200芯片
通过搭积木的方式,英伟达还提供了超级芯片GB200,包含1个Grace CPU+2个B200 GPU,通过900 GB/s的超低功耗NVLink芯片间互连技术连接在一起。而两个GB200装到主板上,就成为了一个Blackwell计算节点。
将18个Blackwell计算节点叠加,则诞生了英伟达“新一代计算单元”DGX GB200 NVL 72,包含36个CPU+72个GPU。它们之间由NVIDIA Quantum-X800 InfiniBand和Spectrum™-X800以太网平台连接,可提供速度高达800Gb/s的网络。
单独使用的DGX GB200 NVL 72,其FP8精度的AI训练性能高达720 PFLOPs,拥有1.4 EFlops的AI推理算力和30 TB高速内存。与相同数量的72个H100相比,大模型推理性能提升30倍,成本和能耗降低25倍。
将8个上述“新一代计算单元”Quantum InfiniBand交换机连接,配合散热系统,则形成了DGX SuperPOD超算平台,包含8个“新一代计算单元”,即288个CPU+576个GPU,内存高达240 TB,FP4精度计算性能达到11.5 EFLOPs(每秒11.5百亿亿次)。
此外,英伟达的超算平台,还支持增加额外的机架扩展性能,最终成为包含32000 GPU的分布式超算集群。
黄仁勋难掩兴奋,“英伟达DGX AI超级计算机,就是AI工业革命的工厂”。
由硬及软,发布新创收产品NIM
事实上,仅凭GPU与算力,“卖铲人”英伟达已经坐稳万亿美元市值。但显然,黄仁勋不甘心将公司仅仅定位为GPU公司、硬件公司。
在2023年的GTC大会上,英伟达即发布了DGX Cloud人工智能云服务。这是一项人工智能超级计算服务,它可以让企业快速访问为生成式人工智能和其他开创性应用训练高级模型所需的基础设施和软件。黄仁勋称,该服务可让企业和软件开发人员通过浏览器登入,即可获得英伟达的超级计算机DGX的AI算力。
叠加NVIDIA AI Enterprise 5.0等软件产品,英伟达在2024财年第四财季,来自软件部分的收入就已达10亿美元。
于是在本届GTC大会上,为了让传统企业,“简单粗暴”地部署并完全利用自己数据,打造专属行业模型。英伟达推出了全新的AI推理微服务——NVIDIA NIM,能够帮助开发者将部署时间,从周缩短至分钟级。企业可以使用这些服务在自己的平台上创建和部署自定义应用,同时保留对其知识产权的完全所有权和控制权。
据介绍,NVIDIA NIM可对来自英伟达及其合作伙伴生态系统的20多个主流的AI模型进行优化推理。
此外,英伟达自己的开发套件、软件库和工具包都可以作为NVIDIA CUDA-X™微服务访问,用于检索增强生成 (RAG)、防护栏、数据处理、高性能计算(HPC)等。通过这些微服务,客户可以轻松构建基于大模型和向量数据库的ChatPDF产品,甚至智能体Agent应用。
NVIDIA NIM支持客户使用旧的英伟达GPU进行推理,并允许这些公司继续使用英伟达已经拥有的数亿个GPU。黄仁勋还表示,NVIDIA NIM将帮助在配备GPU的笔记本电脑上运行人工智能,而不是在云服务器上运行。
在商业模式上,黄仁勋则似乎用上了“薄利多销”的策略:购买英伟达服务器的客户需要注册英伟达企业版,“一个GPU一小时一美元”,同时也支持年费打五折,即每个GPU每年收取4500美元。
目前,英伟达全公司已经都用上了NVIDIA Nim,包括Box、Cloudera、Cohesity、Datastax、Dropbox等合作伙伴也都已经参与NVIDIA Nim的使用和优化过程。
黄仁勋表示:“成熟的企业平台坐拥数据金矿,他们掌握了大量可以转化为副驾驶的数据,当你准备好运行这些人工智能聊天机器人时,你将需要一个人工智能铸造厂”。NVIDIA NIM正是这样一个铸造厂,它帮助构建企业AI转型的Copilot级产品,可以被视为公司AI化所需的基石。
值得一提的是,在本次GTC大会上,黄仁勋还宣布,两年前发布的NVIDIA Omniverse Cloud将可以连接到苹果公司混合头显Vision Pro。而在他演讲时展示的诸多场景中,Vision Pro也是频频出镜,诸多开发者佩戴该产品,在元宇宙的工业领域探索“空间计算”。
GR00T人形机器人项目,加速具身智能浪潮到来
早在2023年5月,黄仁勋就曾表示,人工智能的下一个浪潮将是“具身智能”。
彼时,GGII发布的报告也预测,预计到2026年,人形机器人在全球服务机器人市场中的渗透率预计将达到3.5%,市场规模超过20亿美元,到2030年全球市场规模有望突破200亿美元。
而对机器人领域的开发赋能,也被外界视为英伟达下一个万亿美元市值的增长点。
为了加速这一浪潮的到来,今年初,英伟达资深科学家Jim Fan刚刚宣布建立GEAR工作室,相关研究成果以及研究基础环境成为英伟达新机器人解决方案的基础。
在本次GTC大会上,黄仁勋还宣布了一个名为GR00T的人形机器人项目,旨在进一步推动英伟达在机器人和具身智能的突破性工作。
现场展示中,除了机器人影像外,迪士尼的orange和green机器人也来到现场,这款机器人用的就是英伟达为机器人设计的首款AI芯片Jetson。
据介绍,由GR00T驱动的机器人可以理解自然语言,并通过观察人类动作来模拟运动。
目前,英伟达正在构建包括NVIDIA IAI、Omniverse、ISAAC三大平台,三大平台均与机器人产业高度关联。
其中,NVIDIA IAI搭载DGX系列产品,用于模拟物理世界;Omnivese搭载RTX和OVX系列产品,用于驱动数字孪生的计算系统;ISAAC搭载AGX系列,用于驱动人工智能机器人。
为了给GR00T项目提供软件支持,基于英伟达Omniverse构建的ISAAC Lab也进行了同步更新,允许开发者利用该平台模拟机器人学习技能、与物理世界模拟互动,支持数千个机器人同步训练与模拟。
黄仁勋表示:“为通用人形机器人构建基础模型,是当今人工智能领域最令人兴奋的问题之一。这些使能技术正在汇聚在一起,让世界各地领先的机器人专家在人工通用机器人领域取得巨大飞跃。”