来源:猎云网。
大模型领域,出现罕见一幕!
近日,斯坦福某AI团队(下称:斯坦福团队)被曝抄袭面壁智能开源成果,有“套壳”嫌疑:模型结构和代码“展现出惊人的相似度”。
针对此事,知乎CTO、面壁智能CEO李大海表示:我们对这件事深表遗憾!一方面感慨这也是一种受到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。
对于“抄袭”行为本身,面壁智能方面也给出了补充介绍。
李大海介绍到,“经过团队核实,除了社区网友列出的证据外,我们还发现 Llama3V展现出和小钢炮一样的清华简识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加tricky的是,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。”
事件始于5月29日,斯坦福团队发布Llama3V项目,并宣称500美元即可训练出一个多模态大模型,效果比肩GPT-4V、Gemini Ultra、Claude Opus等。
凭借着低廉的价格、优秀的团队背景,上述模型发布的推文在X平台(推特)获得了较大关注。
大量关注下,随即被眼尖的网友发现,Llama3V项目与面壁智能最新发布的多模态模型MiniCPM-Llama3-V 2.5“雷同”。
面对越来越多的抄袭“质疑”,斯坦福团队也从最初的“狡辩”,变成了“删库跑路”。至此,“抄袭”风波渐息。
经历此事,李大海不无感慨,“ 技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”