执行摘要
OpenAI 工程师演示新的开源 Agents SDK,重点包括类似 Codex 的模型原生 harness、临时沙盒执行环境,以及基于 Cloudflare R2 的文件系统快照状态管理。
Agents SDK 将编排逻辑与底层计算分离,把活跃运行环境转化为可重新加载状态的临时沙盒。
平台抽象让同一 agent 逻辑可以部署到 Modal、Cloudflare、Vercel 和本地 Docker 等运行时。
内置异步 shell 工具循环支持跨多天监控长周期多步骤轨迹,而不锁定开发者本机依赖。
关键要点
- 前沿模型在维持数天或数周自治执行路径的能力上呈现明显上升趋势。
- 内部安全 agents 利用 Codex 基础设施持续分析并修补深层遗留软件代码库漏洞。
- 手写循环跟踪的编排复杂度,被原生工具压缩和上下文滚动窗口替代。
- 一等沙盒能力支持并行隔离容器执行,并配合域名级出站和入站网络过滤。
- 标准能力包包括自动文件系统 patch 生成、内联 diff 应用和异步 shell 命令处理。
- 新的 TypeScript 框架实现匹配原有 Python 版本核心功能,扩展多租户应用支持。
- 外部块存储可以通过兼容 S3 或 Cloudflare R2 的策略,以网络文件结构形式挂载。
构建者启发
- 停止把时间耗在自定义 agent loop 上,优先采用为分发优化的模型原生 harness。
- 从运行时容器中移除敏感操作密钥和凭据,降低提示注入与外泄风险。
- 把对话 rollout 和压缩文件快照存储为干净的 JSON 数据库记录,支持多节点暂停和恢复。
- 使用 human-in-the-loop 函数装饰器,显式拦截部署状态切换等关键运行时操作。
- 部署分层多 agent supervisor 系统,通过消息层跟踪独立的专用 worker 容器。
待验证事项
- 测试从 R2 bucket 拉取大型文件 tarball 时的容器启动与快照重建延迟。
- 验证上下文压缩算法在 50 轮以上工具循环中对语义保真的影响。
- 测量本地复制沙盒文件资产与网络挂载存储路径之间的运行性能差异。
- 确认对 hosted responses 容器应用严格域名 allow-list 时的网络边界隔离一致性。
