Google I/O 2026 大会以一项重磅宣告拉开帷幕:我们已步入智能体时代,AI智能体不再只是响应指令——它们能主动执行复杂任务、理解物理世界,并无缝融入日常生活。今年的主题演讲带来了诸多颠覆性发布,从下一代Gemini模型到智能体优先的开发平台,再到AI驱动的硬件设备。以下是所有重大发布内容的完整盘点。
Gemini 3.5 Flash:高速AI主力模型
本次大会的焦点Gemini 3.5 Flash现已成为Gemini应用、搜索AI模式及Gemini API的默认模型。其姊妹模型Gemini 3.5 Pro目前处于封闭测试阶段,将于下月正式推出。在性能方面,它在多项核心基准测试中均超越Gemini 3.1 Pro:
- Terminal-Bench 2.1编码测试:准确率76.2%(较之前的70.3%有所提升)
- GDPval-AA真实任务测试:Elo得分1656分(对比Gemini 3.1 Pro的1314分)
- MCP Atlas工具调用:成功率83.6%(较之前的78.2%有所提升)
- CharXiv多模态推理:准确率84.2%
速度是另一大亮点:它的输出速度达每秒289个token,是竞品领先模型的4倍。借助Antigravity优化,速度可提升至12倍。定价同样极具竞争力:每百万输入token仅需1.5美元,每百万输出token需9美元,缓存输入token每百万仅0.15美元,同时支持100万token的上下文窗口。这比同类模型便宜50%以上,顶级云客户已将80%的高级工作负载切换至该模型,每年节省超100亿美元。
该模型的采用率飙升:谷歌内部开发者每日使用量达3万亿token,两个月内增长了6倍;超过375家外部客户每月处理的token量均超1万亿。
Gemini Omni:多模态世界模型
谷歌推出了Gemini Omni,这是一款统一的多模态模型,融合了Gemini的推理能力与Veo、Nano Banana、Genie的生成能力。它不仅能处理文本和图像,还能理解现实世界的物理规律、空间关系与因果链,可从任意输入生成任意模态内容。
核心应用场景包括:
- 物理模拟:生成科学精准的蛋白质折叠黏土动画
- 对话式视频编辑:修改自拍视频风格、添加元素或切换视角,同时保留原始动作
Gemini Omni Flash现已在Gemini应用、Google Flow及YouTube Shorts上线(Shorts用户可免费使用)。在Gemini应用和Flow中使用需订阅AI Plus、Pro或Ultra套餐,Omni Pro版本即将推出。
Antigravity 2.0:规模化构建智能体
Antigravity已从一款IDE扩展升级为完整的智能体优先开发平台,提供四种使用形式:独立桌面应用(支持macOS/Linux/Windows)、命令行界面(CLI)、软件开发工具包(SDK),以及Gemini API中的托管智能体。
桌面应用可作为智能体编排工具,支持多智能体并行工作流,新增了定时任务、JSON钩子、项目级权限及/goal斜杠命令等功能。在演示中,开发者借助Gemini 3.5 Flash和子智能体,仅用12小时便构建出可运行《毁灭战士》(Doom)的功能性操作系统——过程使用了93个子智能体、15000次模型请求、26亿个token,成本不足1000美元。
基于Go语言重写的CLI将取代原Gemini CLI,后者将与Code Assist IDE插件一同于6月18日停用,用户需进行迁移。SDK允许团队在自有基础设施上定义并部署自定义智能体;托管智能体则支持用户通过单次API调用启动独立的Linux沙箱智能体,可保留状态并支持扩展Markdown技能。
AI Studio也完成了更新,集成了Antigravity的编码智能体,并新增一款移动应用,可生成原生Android/Kotlin/Jetpack Compose应用,同时支持浏览器内模拟器及Play Console内部测试渠道。前两次云部署免费。
Gemini Spark:你的专属AI智能体
Gemini Spark由Gemini 3.5 Flash和Antigravity Harness提供支持,是一款运行在专属谷歌云虚拟机上的私有AI智能体,可通过Gemini应用、邮件及聊天工具全天候访问。
核心功能包括跨工作区执行任务(覆盖Gmail、Drive、Sheets、Slides及Calendar)、创建自定义技能、语音输入拆分多任务,以及敏感操作的暂停与审批机制。在Mac端,用户可选中文件并通过语音生成带表格的邮件,智能体还会自动修正模糊指令。
上线时间与定价:受信任测试者本周即可访问,下周将向美国AI Ultra订阅用户推出测试版。新推出的Ultra套餐定价为每月100美元,原顶级套餐(每月250美元)降至每月200美元。该智能体将于今夏登陆Chrome浏览器,今年晚些时候接入Android Halo,不久后还将与MCP集成,Instacart为首发合作伙伴。
谷歌搜索:为智能体时代重塑
搜索的AI模式已升级为Gemini 3.5 Flash,月活跃用户超10亿,查询量每季度翻倍——上季度搜索总查询量创下历史新高,AI概览的月用户量达25亿。
此次推出的新搜索框是25年来最大的更新,支持多模态输入(文本、图片、文件、视频、Chrome标签页)及实时AI建议,今日全球上线。AI概览与AI模式现已合并,用户可从主结果页的AI答案无缝切换至AI模式,进行上下文连贯的后续查询——该功能今日已在桌面端和移动端上线。
搜索智能体允许用户创建全天候运行的后台信息智能体,处理特定条件下的股票追踪、找房等复杂任务,今夏将与Gemini Spark集成。基于Antigravity编码能力构建的生成式UI,可为搜索问题创建自定义交互式界面——今夏免费开放使用,订阅用户还可自行构建。
电商重构:三大颠覆性工具
谷歌推出三项电商创新,简化智能体驱动的交易流程:
- 通用电商协议(UCP):与亚马逊、Meta联合开发的开源协议,为智能体与电商系统定义了贯穿整个客户旅程的通用语言。该协议将拓展至酒店、本地配送及YouTube领域,不久后将在加拿大、澳大利亚和英国上线。
- 智能体支付协议(AP2):允许用户设置购买限额,满足条件时可自动完成购买。它采用防篡改的隐私加密数字授权函,并在交易各方之间共享退货记录——率先与Gemini Spark一同推出。
- 通用购物车:覆盖搜索、Gemini、YouTube及Gmail的跨平台购物车,可自动追踪价格下跌、库存水平、折扣及产品兼容性,并匹配Google Wallet信用卡优惠。今夏将在美国的搜索和Gemini应用上线,随后拓展至YouTube和Gmail。
Gemini应用及创意工具:为创意与生产力重塑
Gemini应用借助神经表现力(Neural Expressive)完成全面重设计,具备流畅动画效果、自定义内容生成功能及方言支持——今日已在全球Android、iOS及网页端上线。
新增工具包括:
- 每日简报(Daily Brief):自动汇总并整理收件箱及其他来源的信息,同时提供可执行的下一步建议——今日已向美国AI Plus/Pro/Ultra订阅用户开放。
- 应用内Gemini Omni:付费订阅用户现可在应用内使用Omni进行视频创作与编辑,今日已上线。
- Google Pics:Workspace旗下的AI图像创作与编辑工具,支持SynthID水印功能,今夏推出。
- Stitch:支持实时语音协作的UI设计工具,可导出代码并一键发布网站——今日已在全球上线。
- Google Flow:现已支持Gemini Omni,可从单张图片生成16种不同拍摄角度的视频,同时新增Flow智能体、Flow工具及Flow音乐——全部功能今日上线。
- Docs Live:允许用户通过语音输入生成并编辑文档,自动从Drive和Gmail调取素材——今夏向Pro/Ultra订阅用户推出,支持与Gmail和Keep同步。
智能眼镜:触手可及(及眼)的AI
谷歌与三星合作打造硬件,与Gentle Monster、Warby Parker合作设计,推出两款兼容Android和iOS的智能眼镜:
- 音频智能眼镜:将于今秋推出,具备骨传导Gemini语音对话、免提导航及应用动作委托(如点咖啡)功能。
- 显示智能眼镜:目前处于测试阶段,镜内搭载小型屏幕,可查看网约车信息、实时翻译及自定义界面。开发者正在构建相关体验,更多细节将于今年晚些时候公布。
DeepMind:推进科学与AI安全
DeepMind展示了科学研究与AI安全领域的突破性成果:
- 科研版Gemini:包含三款实验工具——文献洞察(Literature Insights)、计算发现(Computational Discovery)、假设生成(Hypothesis Generation),搭配Co-Scientist多智能体研究伙伴。
- AlphaEarth Foundations:一款行星级数字孪生系统,可模拟森林退化等动态系统。
- WeatherNext:在2025年飓风季提前3天精准预测了飓风梅丽莎的路径,表现优于传统模型,现已成为美国国家飓风中心的常规工具。
- Isomorphic Labs:通过分子交互建模加速药物研发,多个项目已进入临床前阶段。
- 安全工具:SynthID已为1000亿张图片、视频及6万年音频添加水印,OpenAI已采用该技术。内容凭证验证功能拓展至搜索和Chrome浏览器,同时新增AI内容检测API。CodeMender安全智能体的API现已开放测试。
从基础模型升级到智能体优先开发工具,再到AI集成硬件,Google I/O 2026清晰展现了智能体时代的潜力。每一项发布都紧扣一个愿景:让AI智能体对所有人而言都触手可及、功能强大且安全可靠。未来数月,随着这些工具逐步落地,我们看到的并非简单的版本迭代,而是人与技术交互方式的范式转变。