GPT-5败下阵,这款中国AI拿下全球第一,众多医生已在用它做诊断

它做诊断 2025 年 11 月 17 日,据量子位报道,一款名为 “未来医生 AI 工作室” 的中国医疗 AI 系统,在临床 “安全” 与 “有效性” 评测中击败包括 GPT-5 在内的国际顶尖大模型,斩获全球第一。目前,已有众多医生将其应用于日常诊断工作,为基层医疗困境带来新的解决方案。

政策导向下,基层医疗 AI 需求迫切

当下,基层门诊医生面临着巨大的工作压力:患者数量多、病种繁杂,查文献、请会诊的时间被严重压缩;同时,慢病患者增多、随访任务加重,让诊室之外的工作同样棘手。在此背景下,国家卫健委于本月发布《促进和规范 “人工智能 + 医疗卫生” 应用发展的实施意见》,明确将 “人工智能 + 基层应用” 列为八大重点方向之首,并提出到 2030 年实现基层诊疗智能辅助应用基本全覆盖的目标。如何将政策转化为临床实效,打造真正能帮到基层医生的 AI 工具,成为行业关注的焦点。

北京大学第三医院运动医学科江东教授指出:“医疗 AI 的第一性原理,不是聪明,而是安全。” 这一观点得到了业内专家的普遍认同。基层医生真正需要的 AI,需在诊中辅助临床决策,做到安全、有效;在诊后支撑患者随访,实现规范、可持续,而非徒有其表的 “炫技型” 工具。

击败国际顶尖模型,中国 AI 凭实力夺冠

今年 7 月,一项由 32 位国内顶尖临床专家组织的 “多模型临床实战测评” 结果公开发布。该测评搭建了可量化的 “安全性 / 有效性” 临床评估标准,从真实病历中整理出 2069 道开放式问题,覆盖 26 个临床科室,模拟真实诊疗场景,对包括 OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B 及未来医生 AI 工作室核心模型 MedGPT 在内的国际前沿大模型进行全面测试。

测评结果显示,多款通用大模型在高风险问题(如药物相互作用、危重识别、并发症预警)上得分明显下滑,面对婴儿、儿童、免疫低下、慢病等易损人群时,甚至出现 “偶尔聪明,偶尔危险” 的不稳定表现。而 MedGPT 则展现出压倒性优势:总分领先第二名 15.3%,安全性得分比全部模型平均水平高出近 70%,在儿童、孕产妇、老年人等复杂人群场景中表现稳健,鲜少出错,最终夺得全球第一。

之所以能取得如此亮眼的成绩,关键在于 MedGPT 与 GPT-5 等通用大模型的底层设计思路截然不同。GPT-5 本质是 “根据概率生成最可能的句子”,而 MedGPT 从架构底层就围绕临床推理、安全可控、循证链可追溯打造,目标并非 “回答得像人”,而是确保每一句话都安全、可验证、能复盘,完全契合国家卫健委 “坚持安全可控原则” 的要求。

精准解决临床痛点,两大 AI 助手获医生认可

未来医生 AI 工作室并非单一工具,而是针对临床诊疗中医生最吃力的两个环节,打造了两款场景化 AI 助手,切实融入医生工作流。

诊中:临床决策 AI 助手当 “智能参谋”

在紧张的诊室环境中,医生需在短时间内厘清病情风险、判断用药安全、确定检查项目,压力巨大。未来医生 AI 工作室的临床决策 AI 助手,就像一位懂临床的 “智能参谋”,其操作贴合实际工作场景:医生用口语描述病情即可被精准理解,无需规范术语;系统能自动梳理症状链、风险点及缺失信息,实时提示药物冲突、高危体征、特殊人群禁忌,并只引用高等级医学证据,每项建议都附带标注指南出处和证据等级的 “证据卡”,方便医生复核。

中山大学附属第一医院泌尿男科主任邓春华教授曾参与一场 “同题测评”,将分歧较大的典型疑难病例交由 GPT-5、OpenEvidence 与该临床决策 AI 助手分析。结果显示,该助手在多病共存与药物序贯优化、时间窗决策与风险取舍、不确定性推理与检查价值、用药相互作用与复合毒性等 8 个临床关键维度上,均优于另外两款模型。邓春华教授评价道:“它会帮我看到盲区,启发思考,让基层医生也能像专家那样有理、有据、有边界地分析病例。”

多位基层医生反馈,这款助手能在高强度工作节奏中,帮助他们快速识别风险点、理清复杂病例思路,减少遗漏和误判的焦虑,增添诊疗信心。有医生表示:“文献精准,能帮助快速判断病情,用药参考全面,专业性高,不会出现其他 AI 提供假数据的情况。”

诊后:患者随访 AI 助手做 “懂事助理”

诊后管理,尤其是慢病管理,同样让医生头疼。一位基层社区医生常需负责几百名患者,难以实时掌握患者身体状况变化。未来医生 AI 工作室的患者随访 AI 助手,恰好解决了这一难题。它能自动提醒患者复查、记录症状、调整生活方式,对普通健康咨询即时答复;一旦遇到药物调整、症状加重等医疗问题,会自动上报医生确认;当患者提及 “胸闷”“头晕” 等高危词时,还能自动识别风险并发出高危预警,让医生及时介入。

解放军总医院第六医学中心(海军总医院)内分泌科主任医师、全科教研室主任郭启煜连续使用一段时间后评价:“它帮我看到那些已经出院、但仍需要被关注的人。” 这句话道出了随访的核心价值 —— 关注患者出院后的长期健康状况。不少社区医生也惊喜地表示:“原来随访也能这么省心。”

坚持人机协同,成基层医疗 AI 最佳实践

未来医生 AI 工作室之所以能快速在一线落地,获得数十位全国学科主委及大量基层医生的认可,关键在于它始终坚守 “人机协同” 的底线,从未试图取代医生。无论是诊中的临床决策辅助,还是诊后的患者随访管理,AI 都只承担思路提示、证据索引和风险提示的角色,最终的诊疗判断权始终牢牢掌握在医生手中。

这种设计让医生拥有三重安全感:一是 AI 建议安全有效、可信;二是 AI 的每句话都有出处、有边界,可回溯、可解释、可预警,无 “黑箱” 操作;三是医生能完全掌控诊疗过程,不是 “AI 带医生走”,而是 “医生多了一双可靠的眼睛”。正如一位医生所说:“它不是替我做决定,而是让我做决定更稳。”

目前,未来医生 AI 工作室已覆盖临床医学 26 个二级学科方向、109 个亚专科(覆盖 95% 以上),涵盖 30000 余种疾病,依托 50000 余份疾病指南 / 共识、800 万余例问诊病例库、1200 余条临床路径,为医生提供有力支持。医生可通过微信搜索 “未来医生 AI 工作室” 体验该工具,开启 “超级医生个体时代”。

这款中国 AI 的崛起,不仅打破了国际通用大模型在医疗领域的优势,更重要的是为基层医疗注入了新的活力,让 AI 真正成为医生可信赖、离不开的伙伴

© 版权声明

相关文章