MentX多模态医学推理全球第二，中国区第一

2025-11-17

在近日公布的国际权威医学多模态推理评测集MedXpertQA的MM子集榜单中，由中国企业缘启智慧（北京）科技有限公司自主研发的医疗AI智能体MentX一举斩获中国区第一名，全球第二，力压GPT-4o、GPT-5-mini等国际主流大模型，展现出“断崖式”领先优势。

此次MedXpertQA评测为全球公开、标准化的多模态医学推理挑战，涵盖复杂临床场景下的影像识别、病历理解与诊断推理能力评估，吸引了来自中美欧多地的主流AI模型参与，被誉为“医疗AI领域的奥林匹克”。在这一国际化舞台上，MentX不仅跻身全球前列，更以显著优势成为中国唯一进入第一梯队的医疗智能体。

数据显示，MentX在“多模态推理”（Reasoning）和“医学理解”（Understanding）两项核心指标上分别取得69.38分和72.36分的优异成绩，综合得分70.19%，仅次于顶尖模型GPT-5（72.18%），但大幅领先于GPT-4o（42.8%）、GPT-5-mini（60.94%）及人类预执业专家水平（45.53%），实现了对国际主流模型的全面超越。

尤为值得关注的是，排名领先的GPT-5系列模型训练数据主要基于欧美人群的医疗记录，相比之下，MentX从研发之初即聚焦中国临床实践，依托国家卫健委临床医学指南和医学共识，深度融合国人的病理特征、诊疗习惯，在电子病历、医学影像与实验室检查等多源信息融合方面更具本土适应性。