Google 发布 Gemini 3 并推出 agent 开发平台 Antigravity
2026-06-28 · Google
要点
- Gemini 3 Pro 登顶 LMArena:发布即以 1501 Elo 排名第一,被定位为 Google「最智能的模型」
- 1M 上下文 + 全模态:原生理解文本/图片/音频/视频/代码
- 推理大幅跃升:GPQA Diamond 91.9%,Deep Think 模式进一步推到 93.8%
- vibe coding 标杆:WebDev Arena 1487 Elo,零样本生成交互式 Web UI
- 同步发布 Google Antigravity:agent-first 开发平台,agent 可直接操作编辑器、终端、浏览器
事件时间:2025 年 11 月 18 日。本文为 AIHO 收录整理。
Gemini 3 Pro:全面跃升
相比 Gemini 2.5 Pro,Gemini 3 Pro 在推理、多模态和 agentic 能力上全面升级:
| 基准 | Gemini 3 Pro | 说明 |
|---|---|---|
| LMArena | 1501 Elo | 发布时登顶 |
| GPQA Diamond | 91.9% | 博士级科学推理 |
| Humanity's Last Exam | 37.5% | 无工具 |
| SWE-bench Verified | 76.2% | 纯编程 |
| Terminal-Bench 2.0 | 54.2% | 终端操作 |
| WebDev Arena | 1487 Elo | 前端生成 |
模型规格、定价与避坑详见 Gemini 3 Pro 模型卡。
Google Antigravity:从「工具」到「主动伙伴」
Antigravity 是 Google 同步发布的 agent-first 开发平台,核心理念是把 AI 从「工具」变成「主动伙伴」:
- agent 拥有对编辑器、终端、浏览器的直接访问权
- 可自主规划、执行、验证端到端的软件任务
- 集成三个模型:Gemini 3 Pro(主力)、Gemini 2.5 Computer Use(浏览器控制)、Nano Banana(图像编辑)
这是大厂首个旗舰级 agentic IDE,与 Cursor 2.0、GitHub Agent HQ 等共同把「agent 编排」推向 2026 年的主流形态。
长程 Agent 能力
Gemini 3 Pro 在 Vending-Bench 2(模拟经营一家自动售货机生意一整年)上登顶,证明能维持长周期目标不漂移。配合 Gemini Agent,可处理预订本地服务、整理 Gmail 收件箱等多步工作流。
AIHO 观点
Gemini 3 的发布把模型竞争重新拉回「Google 也在第一梯队」的格局——尤其多模态 + 超长上下文 + vibe coding 这个组合,是它区别于 Claude Opus 4.5(最强纯编程 agent)的差异点。Antigravity 则标志着 IDE 形态从「补全/对话」彻底转向「agent 编排」。
国内开发者注意:Gemini 3 无官方直连,需 Vertex AI 或中转。