【量子位 2026年2月6日讯】当大模型还在为“记不住上下文”困扰时,一支后起之秀已交出颠覆性答卷。近日,由陈天桥与邓亚峰联合创立的EverMind团队,正式发布AI长期记忆系统EverMemOS——这款仅用4个月研发的产品,在LoCoMo、LongMemEval等四大主流记忆基准测试中全面超越现有方案,以93.05%的综合准确率登顶SOTA(当前最优水平)。更值得关注的是,团队不仅开源全部代码、上线便捷云服务,还联合OpenAI等机构发起全球记忆挑战赛,拿出8万美元奖金池招揽全球开发者,加速大模型记忆生态建设。
一、直击行业痛点:大模型“失忆”的三大核心困境
当前大模型普遍依赖Transformer架构的自注意力机制实现“记忆”,但受限于上下文窗口长度与KV Cache显存压力,始终面临三大难题:
-
信息截断遗忘:文本长度超过窗口限制(如GPT-4o-mini默认4k Token),早期内容会被直接截断,导致多轮对话中“前聊后忘”。例如协助撰写论文时,AI可能记不住前文确定的选题方向,后续输出内容与初始需求脱节;
-
记忆模糊失真:为节省显存,现有技术常压缩旧记忆,导致细节丢失。比如记录用户“对坚果过敏”,压缩后可能变成“对零食过敏”,引发推荐失误;
-
传统方案局限:业界常用的RAG(检索增强生成)虽能调用外部数据,但会破坏文本连贯性,且时序匹配能力弱——无法区分“用户上周说想旅游”与“用户现在说已旅游归来”的时间差异,导致决策偏差。
EverMemOS的出现,正是瞄准这些痛点,从“类脑记忆”思路出发重构大模型记忆逻辑。
二、类脑设计:三阶段实现“活的记忆”,兼顾精准与连贯
不同于传统“数据库式存储”,EverMemOS模拟人类大脑记忆形成机制,通过三阶段动态处理,让AI记忆具备“连续性、演化性”:
1. 情景轨迹构建(对应海马体功能)
将连续对话拆分为独立的“记忆单元(MemCell)”,每个单元不仅包含聊天内容,还标注关键事实(如“用户2月计划去北京旅游”)、时效信息(如“该计划有效期至3月”)。这种结构化存储,避免了传统RAG“文本切块破坏逻辑”的问题,确保每段记忆的完整性。
2. 语义整合(对应新皮层功能)
将内容相关的MemCell归类为“记忆场景(MemScene)”,同时动态更新用户画像——区分“长期稳定偏好”(如用户喜欢经济型酒店)与“短期临时状态”(如本次旅行需靠近景点)。例如用户多次提及“喜欢吃辣”,系统会将其归为长期偏好;而“本次旅行带父母同行”则标记为短期状态,后续推荐时优先匹配“辣菜餐厅+家庭房”。
3. 重构式回忆(对应前额叶与海马体协同)
用户提问时,系统并非简单检索相似内容,而是结合MemScene智能筛选“必要且足够”的记忆。比如用户问“北京行程怎么安排”,会优先调取“2月旅行计划”“带父母同行”“喜欢经济型酒店”等关键记忆,忽略无关的历史对话(如去年讨论的上海旅行),既保证回答精准,又减少Token消耗。
三、性能碾压:四大基准测试登顶,成本直降60%
在实测中,EverMemOS展现出“精度、效率双优”的特性,全面超越Mem0、Zep等主流记忆系统:
-
LoCoMo测试:基于GPT-4.1-mini backbone时,综合准确率达93.05%,其中多跳推理(需关联多段记忆)准确率提升12.1%,时序任务(需区分时间先后)准确率提升16.1%,Token使用量却比基线方案减少40%;
-
LongMemEval测试:在跨数月、多会话的复杂对话中,以83%的准确率位列第一,能精准关联“用户1月提及的过敏史”与“3月的饮食推荐”;
-
PersonaMem v2测试:在咨询、邮件撰写、创意写作等9大场景中,用户个性化匹配准确率达53.25%,远超“仅用用户画像”或“仅用对话历史”的方案;
-
成本优势:通过“按需提取记忆”而非加载全部历史,推理阶段计算成本降低60%,边缘设备也能流畅运行。
四、开发者友好:开源+云服务,两行代码接入
为降低使用门槛,EverMind团队同步推出开源版本与云服务,覆盖不同需求的开发者:
-
开源版本:代码已托管至GitHub,支持本地部署,需满足Python 3.10+、Docker 20.10+等环境要求,适合需要自定义功能的企业与研究团队;
-
云服务(EverMemOS Cloud):提供托管API,开发者只需两行代码即可调用记忆功能——包括记忆摄入(提取交互信息)、检索(按元数据筛选)、搜索(关键字混合检索),核心引擎自动更新,无需维护基础设施。目前云服务已开放内测,用户填写邮箱即可免费体验。
五、全球挑战赛:8万美元寻人才,覆盖全技术链路
为推动记忆技术落地,EverMind联合OpenAI、LangChain等10余个技术社区,发起“2026记忆起源大赛(Memory Genesis Competition)”,设置三大赛道,总奖金池达8万美元:
-
记忆+智能体赛道:需构建具备长期进化能力的智能体(如个人数字孪生、医疗保健助手),选出5名获奖者,每人奖励5000美元;
-
平台插件赛道:为VSCode、Slack、Notion等工具开发EverMemOS扩展插件,选出7名获奖者,每人奖励3000美元;
-
操作系统基础设施赛道:优化EverMemOS核心功能(如性能调优、架构改进),选出3名获奖者,每人奖励3000美元。
此外,大赛还设置总冠军(额外1万美元)、人气开发者(额外5000美元)等特别奖项,顶级贡献者可获得EverMind全职offer或技术顾问邀请。目前报名通道已开启,开发者需在2月底前提交项目,可通过赛事官网获取导师指导。
六、行业意义:记忆成AI下半场核心竞争力
随着大模型能力逐渐同质化,“记忆”正成为差异化竞争的关键。正如陈天桥在天桥脑科学研究院研讨会上所言:“人类智能的核心是时间流中的记忆与推理,当前AI的‘空间结构’范式只能拟合世界快照,而长期记忆是让AI拥有时间连续性的关键。”
EverMemOS的突破,不仅为大模型提供了“可插拔的记忆外挂”,更重新定义了AI记忆的技术路线——从“被动存储”转向“主动演化”。而全球挑战赛的发起,也预示着AI记忆领域从“单点技术突破”进入“生态协同建设”阶段。对于开发者与企业而言,这场由陈天桥、邓亚峰带队掀起的“记忆革命”,或许正是抢占下一代AI基础设施的关键机遇。
我可以帮你整理EverMemOS的技术架构图、云服务接入步骤及挑战赛报名指南,制作成一份“开发者快速手册”,方便你直接上手使用或参与赛事。需要我这样做吗?