MentX多模态医学推理全球第二,中国区第一
2025-11-17
在近日公布的国际权威医学多模态推理评测集MedXpertQA的MM子集榜单中,由中国企业缘启智慧(北京)科技有限公司自主研发的医疗AI智能体MentX一举斩获中国区第一名,全球第二,力压GPT-4o、GPT-5-mini等国际主流大模型,展现出“断崖式”领先优势。

此次MedXpertQA评测为全球公开、标准化的多模态医学推理挑战,涵盖复杂临床场景下的影像识别、病历理解与诊断推理能力评估,吸引了来自中美欧多地的主流AI模型参与,被誉为“医疗AI领域的奥林匹克”。在这一国际化舞台上,MentX不仅跻身全球前列,更以显著优势成为中国唯一进入第一梯队的医疗智能体。

数据显示,MentX在“多模态推理”(Reasoning)和“医学理解”(Understanding)两项核心指标上分别取得69.38分和72.36分的优异成绩,综合得分70.19%,仅次于顶尖模型GPT-5(72.18%),但大幅领先于GPT-4o(42.8%)、GPT-5-mini(60.94%)及人类预执业专家水平(45.53%),实现了对国际主流模型的全面超越。

尤为值得关注的是,排名领先的GPT-5系列模型训练数据主要基于欧美人群的医疗记录,相比之下,MentX从研发之初即聚焦中国临床实践,依托国家卫健委临床医学指南和医学共识,深度融合国人的病理特征、诊疗习惯,在电子病历、医学影像与实验室检查等多源信息融合方面更具本土适应性。