蚂蚁“安诊儿”医疗大模型开源即登顶:千亿参数破解基层看病难题,H20硬件可流畅运行

【量子位 2026年1月10日讯】医疗AI赛道再迎颠覆性突破!蚂蚁集团联合浙江省卫生健康信息中心、浙江省安诊儿医学人工智能科技有限公司,正式开源全球参数规模最大的医疗大模型——蚂蚁·安诊儿(AntAngelMed)。这款拥有1000亿参数的“医疗大脑”,不仅在HealthBench、MedAIBench、MedBench三大中外权威医疗评测中包揽开源模型第一,更以“低门槛、高适配、强共情”特性,让基层医疗机构无需昂贵硬件即可部署,真正打通优质医疗AI资源普惠化的“最后一公里”。

目前,安诊儿已在HuggingFace、ModelScope、GitHub三大平台同步开源,上线首日开发者下载量突破1.2万次,浙江大学医学院附属第二医院、杭州市第七人民医院等2000余家医疗机构已率先接入,累计服务超1.3亿人次。

一、开源即SOTA:横扫三大权威榜单,复杂场景稳赢

医疗大模型的核心竞争力,在于能否在真实临床场景中保持专业与稳定。安诊儿用三大权威评测的“全满贯”成绩,证明其技术硬实力:

1. 打破国际榜单“32分魔咒”

在OpenAI联合全球262名医生构建的HealthBench评测中(涵盖5000种多轮医疗对话场景,评分维度包括准确性、沟通质量、情境感知),安诊儿以62.5分斩获开源模型第一,超越Baichuan-M2、GPT-OSS-120B等知名模型。更值得关注的是,在专为复杂病例设计的HealthBench-Hard子集上,它以38分打破“所有模型低于32分”的行业困境,成为继Baichuan-M2后唯二突破该瓶颈的开源模型——这意味着面对“症状模糊、病史复杂”的疑难病例,安诊儿仍能保持严谨推理,例如准确识别“头晕+乏力+体重骤降”背后的潜在糖尿病风险,而非简单归因为“疲劳”。

2. 适配中文医疗场景,5大维度领先

面向国内医疗体系的MedBench评测(含36个评测集、70万条中文样本)中,安诊儿在医学知识问答、语言理解、复杂推理、安全伦理等五大核心维度均位列第一。以解读乳腺癌病理报告为例,它能将“ER(90%+)、PR(80%+)、HER2(1+)、Ki-67(15%)”等专业指标,转化为“激素受体阳性,适合激素治疗,暂不推荐靶向治疗”的通俗建议,并明确告知患者后续可挂“乳腺内科”咨询用药细节,贴合国内就医流程。

3. 通过国家级安全与伦理验证

在国家人工智能应用中试基地(医疗)·浙江、协和医学院等共建的MedAIBench评测中,安诊儿在医疗伦理、数据安全等维度表现突出。例如面对“患者要求推荐‘偏方’”的场景,它会拒绝非循证建议,并耐心解释“偏方缺乏临床验证”,同时提供正规替代方案,既坚守医疗原则,又避免引发患者抵触情绪。

二、千亿参数却“轻量能跑”:MoE架构实现效率与性能双赢

传统千亿参数模型往往依赖昂贵硬件,难以落地基层。安诊儿通过创新技术设计,做到“参数规模领先,运行门槛亲民”:

1. 混合专家架构(MoE):每次推理仅激活61亿参数

安诊儿采用MoE架构,如同医院“专科分诊”机制——总参数量达1000亿,但针对不同病例仅激活对应“专家模块”(约61亿参数),计算效率较传统Dense架构提升7倍。在普通H20硬件上,其推理速度超200 tokens/s,响应速度是同类模型的3倍,患者描述“反复咳嗽伴胸痛”后,模型能在1秒内给出“警惕肺炎/胸膜炎,建议查胸片+血常规”的初步判断,交互流畅度堪比线下问诊。

2. 国产化适配+低资源占用

模型全链路采用国产化技术路线,支持华为昇腾、海光、飞腾等多种国产芯片,避免技术“卡脖子”;同时通过FP8量化+EAGLE3优化,在压缩数值精度的同时抑制抖动,32并发场景下HumanEval推理吞吐提升71%,Math-500提升94%,县级医院用现有服务器即可部署,无需额外采购高端硬件。

三、从“技术领先”到“临床有用”:三阶段训练打造“有温度的AI医生”

安诊儿的核心优势,不仅在于专业度,更在于贴近真实医疗场景的“共情力”与“实用性”,这源于其独特的三阶段训练体系:

1. 持续预训练:构建“医学知识库”

模型先“研读”海量高质量医疗数据——包括3000+临床指南(如《中国高血压防治指南2025》)、1000万+去隐私化病例、200万+医学文献,确保知识覆盖内外科、儿科、精神科等多领域,例如能准确区分儿童“普通感冒”与“川崎病”的细微症状差异。

2. 监督微调:学会“医生式思考”

通过多源异构指令数据(含模拟问诊对话、病历书写范例),模型学习“分步推理”与“人性化表达”。例如面对焦虑患者询问“头晕是否为脑瘤”,它会先安抚“多数头晕由疲劳、血压波动引起,无需过度恐慌”,再分点分析可能原因,最后给出“先测血压,持续不缓解再做头颅CT”的阶梯式建议,避免引发不必要的恐慌。

3. 双阶段强化学习:兼顾严谨与安全

采用GRPO算法分两步优化:第一步“推理强化”,确保逻辑链完整,例如诊断糖尿病时会依次验证“血糖指标→症状持续时间→家族史”;第二步“通用强化”,明确风险边界,对“自行调整降压药剂量”等危险行为会严厉警示,并强调“必须遵医嘱”,同时标注建议的“置信度”(如“疑似胃炎,置信度92%”),提醒医生结合临床判断。

四、落地场景:从心脏预警到青少年心理,2000家机构验证实效

安诊儿并非“实验室技术”,而是已深度融入临床实践的“超级助手”,在多领域展现实用价值:

1. 专科诊疗:为心脏瓣膜患者打造“智能监护”

与浙江大学医学院附属第二医院王建安院士团队合作的“Jack安心智能体”,基于安诊儿模型实时分析患者心率、血压数据,能提前72小时预警瓣膜功能异常,目前已服务3000余名术后患者,并发症检出率提升40%,复查周期从3个月延长至6个月,减轻患者奔波负担。

2. 精神卫生:青少年心理咨询的“云端陪伴”

杭州市第七人民医院基于安诊儿开发的“云雾精灵”,专注青少年抑郁、焦虑干预。它能通过对话识别“情绪低落+睡眠障碍”等风险信号,用“你最近是不是经常觉得没力气做喜欢的事?”等共情式提问打开沟通缺口,再联动线下医生跟进。上线半年,已为8万名青少年提供心理支持,其中30%的高危用户成功转介至临床干预。

3. 基层医疗:帮社区医生“补经验、省时间”

在浙江部分社区卫生服务中心,安诊儿成为基层医生的“实时顾问”:输入患者症状后,模型会快速匹配相似病例与诊疗指南,例如提示“老年患者+下肢水肿,需排查心衰/肾病”;同时能自动生成规范病历,将医生书写时间从30分钟缩短至5分钟,还能把“白细胞计数偏高”翻译成“体内可能有炎症”,方便患者理解。

五、开源生态:推动医疗AI“普惠化”,全球开发者可免费接入

蚂蚁此次选择将安诊儿全面开源,核心目标是降低医疗AI开发门槛,推动行业协同创新:

1. 全资源免费开放

开发者可通过GitHub、HuggingFace等平台,免费获取模型权重、训练工具、脱敏数据集(含10万+标注病例),无需申请授权即可商用。针对中小医疗机构,蚂蚁还提供“零代码部署工具”,通过可视化界面即可完成模型接入,部署成本降低90%。

2. 构建“安诊儿开源社区”

国家人工智能应用中试基地(医疗)·浙江同步启动开源社区,提供算力支持(每月免费100小时GPU资源)、技术培训(定期开展“医疗AI开发实战营”),并联合10余家高校设立“医疗大模型创新基金”,鼓励开发者针对罕见病、慢病管理等细分场景优化模型。

3. 安全与隐私保障

为避免数据泄露,安诊儿采用“端到端加密”传输,训练数据已去除姓名、身份证号等敏感信息;同时明确“责任边界”——模型建议仅供参考,最终诊疗决策由执业医生做出,平台会记录每一次AI调用日志,便于追溯管理,符合《生成式人工智能服务管理暂行办法》要求。

结语:医疗AI从“高端实验”到“基层刚需”

蚂蚁·安诊儿的开源,不仅是一次技术发布,更标志着医疗AI行业从“比拼参数规模”转向“追求实用普惠”。当千亿参数模型能在普通硬件上流畅运行,当社区医生能借助AI识别疑难病例,当青少年能通过“云端精灵”获得心理支持——优质医疗资源不再是“少数人的特权”,而是逐渐成为像水电一样触手可及的基础服务。

正如蚂蚁健康事业群负责人所言:“医疗AI的终极目标,不是超越医生,而是让每个医生都拥有‘顶级专家团队’的支持,让每个普通人都能在家门口享受到高质量医疗服务。”随着安诊儿开源生态的壮大,这一目标正逐步照进现实。

© 版权声明

相关文章