【量子位 2026年2月14日讯】开源大模型领域迎来里程碑式突破,智谱AI全新发布的GLM-5模型正式将开源AI带入长任务时代。这款模型凭借超24小时连续自主编码、700次稳定工具调用、800次上下文无缝切换的硬核能力,从零构建出功能完整的Game Boy Advance(GBA)模拟器,不仅在权威评测中比肩闭源巨头,更以全栈开发实力重塑开源AI的应用边界。
GLM-5的标志性突破来自于一项近乎“不可能”的工程任务——在无并行计算、无参考代码、关闭网络搜索的严苛条件下,仅用JavaScript就独立完成GBA模拟器开发。该任务需精准实现500多条CPU指令集、内存分页机制、音频子系统与图形渲染时序等复杂功能,任何微小偏差都可能导致项目崩盘。但GLM-5展现出极致稳定性:工具调用从首次到第700次在语法精度上保持一致,上下文切换800次仍严格遵循初始规范,且能通过笔记文件准确恢复工作状态,最终成功运行《精灵宝可梦:火红版》等经典游戏,动态效果流畅自然。
在性能评测中,GLM-5表现惊艳。权威榜单Artificial Analysis显示,其综合能力与闭源旗舰模型Claude Opus 4.5处于同一梯队;在编程专项测试中,GLM-5的表现与Claude Opus 4.5实现对齐,涵盖SWE-bench、Terminal-Bench 2.0等8大主流基准测试;在衡量模型经营能力的Vending Bench 2中,GLM-5更是斩获开源模型第一,展现出跨场景的综合实力。网友们纷纷点赞,称赞其“能制作精美的CAD模型”,更有人评价这是“开源AI应对大型长期项目的巨大飞跃”。
作为开源界首个“全栈架构师”,GLM-5的应用潜力在实测中全面释放。从零生成3D版大富翁游戏,不仅实现2-4人本地联机、经典规则复刻、3D棋子动画等完整功能,还提供详细工程化文档,新手可快速部署;基于three.js开发的光影十二面体,精准还原“双层玻璃壳+泛光效果+多滤镜切换”的复杂需求,拖拽旋转交互流畅;学术版“抖音”PaperTok、3D版《我的世界》克隆体等10余款应用已完成开发,部分已提交苹果App Store审核。此外,完整电商网站、Claude风格桌面Agent等全栈任务,GLM-5均能高效完成,真正实现“输入目标即可交付成品”。
GLM-5的发布引发行业震动,标志着开源大模型从“辅助工具”向“独立工程师”的质变。此前,长任务处理能力一直是闭源模型的专属优势,而GLM-5将这一核心能力开源开放,让全球开发者均可免费使用。这一突破已对SaaS行业产生潜在影响——此前闭源长任务模型的出现曾导致FactSet等软件公司股价暴跌,投资者担忧AI自主开发能力可能重塑软件采购模式,而GLM-5的开源特性进一步加速了这一变革进程。
值得关注的是,GLM-5的成功源于智谱AI在编程领域的长期深耕,从GLM-4.5版本开始,其编码能力就已在国内外积累大量用户。此次发布后,智谱公司大楼更成为开发者打卡地,国外网友纷纷留言“求开放使用权限”,足见其全球影响力。目前,GLM-5已在GitHub、Hugging Face、ModelScope等平台开放下载,GBA模拟器也提供在线体验入口,为开发者提供便捷的实践渠道。
从24小时自主开发模拟器到全栈应用快速交付,GLM-5不仅打破了开源与闭源模型的能力壁垒,更重新定义了AI在开发领域的角色。未来,随着长任务处理能力的持续优化,开源AI有望在更多复杂场景中替代重复劳动,让开发者聚焦创意设计,推动技术创新进入新阶段。这场开源模型的“逆袭”,正为AI产业带来更开放、更普惠的发展可能。