跳到主内容
AIHO 2026 全新改版上线

Google 发布 Gemini 3 并推出 agent 开发平台 Antigravity

2026-06-28 · Google

要点

  • Gemini 3 Pro 登顶 LMArena:发布即以 1501 Elo 排名第一,被定位为 Google「最智能的模型」
  • 1M 上下文 + 全模态:原生理解文本/图片/音频/视频/代码
  • 推理大幅跃升:GPQA Diamond 91.9%,Deep Think 模式进一步推到 93.8%
  • vibe coding 标杆:WebDev Arena 1487 Elo,零样本生成交互式 Web UI
  • 同步发布 Google Antigravity:agent-first 开发平台,agent 可直接操作编辑器、终端、浏览器

事件时间:2025 年 11 月 18 日。本文为 AIHO 收录整理。

Gemini 3 Pro:全面跃升

相比 Gemini 2.5 Pro,Gemini 3 Pro 在推理、多模态和 agentic 能力上全面升级:

基准Gemini 3 Pro说明
LMArena1501 Elo发布时登顶
GPQA Diamond91.9%博士级科学推理
Humanity's Last Exam37.5%无工具
SWE-bench Verified76.2%纯编程
Terminal-Bench 2.054.2%终端操作
WebDev Arena1487 Elo前端生成

模型规格、定价与避坑详见 Gemini 3 Pro 模型卡

Google Antigravity:从「工具」到「主动伙伴」

Antigravity 是 Google 同步发布的 agent-first 开发平台,核心理念是把 AI 从「工具」变成「主动伙伴」:

  • agent 拥有对编辑器、终端、浏览器的直接访问权
  • 可自主规划、执行、验证端到端的软件任务
  • 集成三个模型:Gemini 3 Pro(主力)、Gemini 2.5 Computer Use(浏览器控制)、Nano Banana(图像编辑)

这是大厂首个旗舰级 agentic IDE,与 Cursor 2.0、GitHub Agent HQ 等共同把「agent 编排」推向 2026 年的主流形态。

长程 Agent 能力

Gemini 3 Pro 在 Vending-Bench 2(模拟经营一家自动售货机生意一整年)上登顶,证明能维持长周期目标不漂移。配合 Gemini Agent,可处理预订本地服务、整理 Gmail 收件箱等多步工作流。

AIHO 观点

Gemini 3 的发布把模型竞争重新拉回「Google 也在第一梯队」的格局——尤其多模态 + 超长上下文 + vibe coding 这个组合,是它区别于 Claude Opus 4.5(最强纯编程 agent)的差异点。Antigravity 则标志着 IDE 形态从「补全/对话」彻底转向「agent 编排」。

国内开发者注意:Gemini 3 无官方直连,需 Vertex AI 或中转。

相关阅读