返回 Google 简报

Google AI 新动态:I/O 2026 构建者要点

Google for Developers 概览 Google AI 技术栈:从 Gemini 3.5 模型、AI Studio Build Mode,到 Gemini Live、Gemma 4、TPU 软件、机器人 API 和 Genie 3 世界模型。

处理日期:2026 年 5 月 29 日
Google I/O AI 课程信息图,展示 Gemini 3.5 模型、AI Studio Build Mode、Gemini Live API、Gemma 4、TPU 软件、机器人和 Genie 3。

执行摘要

Google for Developers 将最新 Google AI 路线图呈现为一套全栈构建者系统。课程从 Gemini 3.5 的模型选择讲起,覆盖复杂推理、生产速度和低延迟工作负载,然后把这些模型连接到 AI Studio 的多模态原型构建。

这场分享的实践核心是 AI Studio Build Mode:一个基于浏览器的工作区,可以把自然语言提示转化为可运行的原生 Kotlin Android 应用和 Workspace 风格工具。Google 将它与 Gemini Live API、屏幕共享、Google Search 接地和视频理解放在一起,形成覆盖提示、实时交互、生成代码和可部署应用界面的工作流。

后半部分把技术栈扩展到前沿 API 之外。Gemma 4 被介绍为具备长上下文和本地笔记本部署能力的开放模型家族,而 Google AI Edge Gallery 则把更小模型带到移动设备上。课程还提到 TPU 软件栈、Gemini Robotics 1.6 和 Genie 3,说明 Google AI 平台正在跨越云端、边缘端、物理机器人和模拟世界。

关键要点

  • Google 将 Gemini 3.5 Pro、Gemini 3.5 Flash 和 Gemini 3.1 Flashlight 定位为不同成本、速度和推理能力取舍。
  • AI Studio 的 playground 工作流覆盖文本、音频和视频等多模态输入,包括时间戳提取和代码片段生成。
  • Gemini Live API 与屏幕共享支持实时对话界面,让系统可以围绕视觉上下文推理并切换语言。
  • AI Studio Build Mode 被定位为提示词到应用的工作区,用于生成原生 Kotlin Android 应用和 Workspace 集成。
  • Gemma 4 被介绍为开放模型家族,具备 256K 上下文窗口、广泛语言支持和本地笔记本部署能力。
  • TPU 软件栈强调 JAX、PyTorch 路径、vLLM 和 MaxText,作为训练、调优和推理扩展界面。
  • Gemini Robotics 1.6 和 Genie 3 将课程从应用开发扩展到物理控制和模拟世界生成。

构建者启发

  • 把模型选择当作产品决策:将最大模型留给困难推理,在延迟和成本占主导时使用 Flash 类模型。
  • 在投入本地项目结构或生产基础设施前,先用 AI Studio 做快速多模态原型。
  • 设计实时界面时围绕实时上下文、屏幕理解、接地和语言切换,而不是简单聊天轮次。
  • 把 Build Mode 输出当作生成的应用代码评估:发布前检查权限、架构、数据访问和发布就绪度。
  • 当隐私、离线行为或本地成本控制让客户端推理更有吸引力时,考虑 Gemma 和 AI Edge。
  • 跟踪哪些公告已经可用、哪些仍是路线图项目,尤其是移动端 AI Studio 和 Build Mode 到 Play Store 的分发能力。

待验证事项

  • AI Studio 移动应用在 Android 和 iOS 上的准确推出时间和平台可用性。
  • Build Mode 生成 Android 应用的分发要求、审核约束和许可条款。
  • Gemini Live API 与屏幕共享工作流的延迟、token 使用和安全过滤行为。
  • Gemma 4 本地部署的生产限制,包括内存、量化和支持硬件。
  • Gemini Robotics 1.6 和 Genie 3 在演示或限量访问项目之外的当前可用性。