返回 Google 简报

Google 的软件开发未来:Agents 与信息检索

Google DeepMind 与 Cloud 负责人讨论 Gemini 3.5 Flash、agentic workstation、异步 sub-agents、真实产品基准,以及企业信息检索这一下一阶段软件瓶颈。

处理日期:2026 年 5 月 30 日
信息图比较线性聊天式编码与非线性 agent workstation 和 sub-agent 委派。

执行摘要

Google DeepMind 和 Cloud 负责人讨论 Gemini 3.5 Flash、多智能体 anti-gravity 系统,以及解决企业信息检索瓶颈如何改变软件开发生命周期。

Gemini 3.5 Flash 在复杂工具使用和扩展多步骤轨迹上超过旧模型,并跟踪每秒 200 个 token 以上的执行速度。

工程挑战已经从基础代码生成转向构建结构化多智能体系统,以异步方式委派任务。

企业部署边界更多由数据安全和信息检索能力决定,而不是由基础模型智能上限决定。

关键要点

  • 现代开发基准正在转向真实产品执行模拟,例如为盈利而管理真实电商商店。
  • 集成时,对模型行为的定性和主观开发者反馈,权重可能超过静态代码验证分数。
  • 交互循环已经超越简单文本回合,转向模型编写、构建并递归调整软件任务。
  • AI 交互范式可能围绕高度可信的主界面收敛,并由其原生生成专用 sub-agents。
  • 企业验证流程要求模型知道何时暂停、评估信息缺口,并在继续执行前询问人类。
  • 工程 agents 的核心瓶颈之一,是用实时框架输入处理庞大上下文流。
  • anti-gravity 平台允许 root agent 为异步子任务显式选择不同底层模型配置。

构建者启发

  • 停止围绕单轮聊天框设计工具,改为为连续后台工作流重新架构软件界面。
  • 在所有从零到一的软件项目根目录中直接加入稳健的集成与 playground 测试脚本。
  • 构建明确的 agent 打断规则,管理运行中 agent 可以多频繁提示或提醒人类监督者。
  • 把产品策略聚焦在用户体验和问题发现上,因为基础功能构建正在商品化。
  • 利用模型委派模式,让大模型编排并把狭窄任务分派给快速 Flash 层。

待验证事项

  • 验证执行数千步异步模型循环时的 token 利用率和内存分配。
  • 确认在活跃系统开发 harness 上运行实时强化循环时的延迟差异。
  • 分析给后台 agents 授权访问生产关系数据湖时的数据外泄风险。
  • 评估 Gemini 3.5 Flash 调试数十年遗留代码库与新结构化 Web 应用时的准确度差异。