在今天凌晨举行的 Google I/O 2025 大会上,Google CEO Sundar Pichai 公布了一组关键数据:Gemini App 月活跃用户超过 9 亿,每月处理 3200 万亿 Token,Nano Banana 生成超过 500 亿张图片。Pichai 强调,过去一年 AI 成为行业主旋律,Gemini 已从独立应用升级为 Google 所有产品的底层 AI 能力。本次发布会从模型更新开始,逐步延伸到编程工具和 Agent 平台,并最终进入搜索、Chrome、XR 眼镜等完整生态。
Gemini Omni:从视频生成走向世界模型
DeepMind CEO 将 Gemini Omni 描述为能够“从任何输入创造任何内容”的新模型。该模型结合 Gemini 的推理能力与 Google 既有的生成式媒体模型(如 Veo、Nano Banana、Genie),目标是提升对世界的理解、多模态生成和编辑能力。Google 特别指出,Omni 已开始处理动能、重力等物理层面的问题,而非仅停留在画面生成层面。
现场演示了蛋白质折叠解释视频的生成:用户只需输入“生成一个关于蛋白质折叠的黏土动画解释”,Omni 即可将抽象科学概念转化为视频内容。它还支持通过对话方式编辑视频——修改风格、加入元素、调整细节,例如将普通圆形转为黑洞,或为夜晚散步场景增加戏剧感。
Google 表示,Gemini Omni 从视频开始,后续将逐步走向“任意输入到任意输出”。首个模型 Gemini Omni Flash 已上线,Omni Pro 会在之后公布更多信息。Gemini App 中的 Omni 功能面向 AI Plus、Pro 和 Ultra 订阅用户开放。这意味着 Omni 不只是一个视频生成模型,Google 将其放入“世界模型”叙事中——模型不仅生成画面,还需理解画面中的物理关系、运动关系和场景逻辑。接下来 Omni 将进入 Gemini App、Google Flow 和 YouTube Shorts,使创作工具从图片编辑扩展到视频编辑。
Gemini 3.5 Flash 与 Antigravity 2.0:极速编程与 Agent 平台
如果说 Gemini Omni 侧重生成与编辑,那么 Gemini 3.5 Flash 锁定的则是速度、成本和执行能力。Google 称其为 Gemini 3.5 系列首批模型之一,面向 agentic coding、长周期任务和真实工作流。相比 3.1 Pro,3.5 Flash 在几乎所有基准测试中提升明显,尤其是代码能力和 GDPVal 等经济任务评测。在输出 token 速度上,它比其他前沿模型快 4 倍,在 Antigravity 中经专门优化后可达 12 倍。
Google 内部开发任务每天处理约 5000 亿 Token,随后每几周翻倍,目前已超过每天 3 万亿 Token。Google 将此视为一个反馈循环,用大规模真实使用持续改进 3.5 Flash。
与模型同步推出的 Antigravity 2.0 从原来的 agent powered IDE 升级为独立桌面应用,重点转向 agent first。用户不再通过 AI 辅助编辑代码,而是通过 Agent 对话、Agent 产物和多 Agent 协同完成开发任务。2.0 加入完整 CLI、Antigravity SDK、Gemini 音频模型原生语音支持,并集成 Android、Firebase、Google AI Studio 等服务,已面向全球用户开放。
现场用高强度演示展示了 Antigravity 2.0 的方向:让 Agent 从零构建一个可运行的操作系统。93 个子 Agent 并行执行 12 小时,发起超过 1.5 万次模型请求,处理 26 亿 Token,从空项目生成调度器、内存管理、文件系统等核心模块。Google 称,该任务在 Gemini 3.1 Pro 上无法完成,而仅消耗不到 1000 美元 API credits。演示还成功运行 SL 小火车程序和 Doom,过程中因缺少驱动,Antigravity 自动生成相关代码并修复。Google 表示,类似方式已测试照片编辑套件、即时消息应用、多用户协作平台等项目,原本数天的工程被压缩到数小时甚至更短。
Gemini 3.5 Flash 已面向所有用户开放,覆盖 Google 产品和 API。3.5 Pro 仍在内部使用和改进中。
模型和开发工具之后,Google 还将 AI 能力注入搜索,推出了更深入的 AI 搜索体验。Gemini 正在从一个应用变为整个 Google 生态的智能底座。
本文参考来源:爱范儿
微信扫描下方的二维码阅读本文



