Google 发布 Gemini 3 并推出 agent 开发平台 Antigravity

2026-06-28 · Google

要点

Gemini 3 Pro 登顶 LMArena：发布即以 1501 Elo 排名第一，被定位为 Google「最智能的模型」
1M 上下文 + 全模态：原生理解文本/图片/音频/视频/代码
推理大幅跃升：GPQA Diamond 91.9%，Deep Think 模式进一步推到 93.8%
vibe coding 标杆：WebDev Arena 1487 Elo，零样本生成交互式 Web UI
同步发布 Google Antigravity：agent-first 开发平台，agent 可直接操作编辑器、终端、浏览器

事件时间：2025 年 11 月 18 日。本文为 AIHO 收录整理。

Gemini 3 Pro：全面跃升

相比 Gemini 2.5 Pro，Gemini 3 Pro 在推理、多模态和 agentic 能力上全面升级：

基准	Gemini 3 Pro	说明
LMArena	1501 Elo	发布时登顶
GPQA Diamond	91.9%	博士级科学推理
Humanity's Last Exam	37.5%	无工具
SWE-bench Verified	76.2%	纯编程
Terminal-Bench 2.0	54.2%	终端操作
WebDev Arena	1487 Elo	前端生成

模型规格、定价与避坑详见 Gemini 3 Pro 模型卡。

Google Antigravity：从「工具」到「主动伙伴」

Antigravity 是 Google 同步发布的 agent-first 开发平台，核心理念是把 AI 从「工具」变成「主动伙伴」：

agent 拥有对编辑器、终端、浏览器的直接访问权
可自主规划、执行、验证端到端的软件任务
集成三个模型：Gemini 3 Pro（主力）、Gemini 2.5 Computer Use（浏览器控制）、Nano Banana（图像编辑）

这是大厂首个旗舰级 agentic IDE，与 Cursor 2.0、GitHub Agent HQ 等共同把「agent 编排」推向 2026 年的主流形态。

长程 Agent 能力

Gemini 3 Pro 在 Vending-Bench 2（模拟经营一家自动售货机生意一整年）上登顶，证明能维持长周期目标不漂移。配合 Gemini Agent，可处理预订本地服务、整理 Gmail 收件箱等多步工作流。

AIHO 观点

Gemini 3 的发布把模型竞争重新拉回「Google 也在第一梯队」的格局——尤其多模态 + 超长上下文 + vibe coding 这个组合，是它区别于 Claude Opus 4.5（最强纯编程 agent）的差异点。Antigravity 则标志着 IDE 形态从「补全/对话」彻底转向「agent 编排」。

国内开发者注意：Gemini 3 无官方直连，需 Vertex AI 或中转。

Google 发布 Gemini 3 并推出 agent 开发平台 Antigravity

要点

Gemini 3 Pro：全面跃升

Google Antigravity：从「工具」到「主动伙伴」

长程 Agent 能力

AIHO 观点

相关阅读