执行摘要
这场分享将 Claude 托管代理呈现为用于构建企业代理应用的托管运行时,让团队不必手写每一个编排原语。Isabella He 对比了原始 Messages API 调用、自托管 Agent SDK 工作,以及在 Anthropic 基础设施上处理上下文管理、会话持久性和扩缩容的服务端代理循环。
核心架构思路是将代理的推理循环与工具执行分离。代理循环在服务端运行,工具则在隔离或私有计算环境中运行。视频把这种分离描述为机密信息和凭据的安全边界,同时也是延迟优化;演讲中引用了超过 90% 的 P95 首 token 返回时间降低。
工作坊使用 Claude Opus 4.7、Files API 日志上下文、自定义指标工具、会话和工作区事件构建了一个 SRE 事件响应代理。演示会诊断数据库连接池耗尽并建议下一步行动;不应把它概括为会自动修复生产环境的代理。工作坊之后,子代理、记忆整理、Vault 凭证库和 Webhook 等高级原语被介绍为部署构建块。
关键要点
- Claude 托管代理将核心代理循环移到 Anthropic 基础设施上,而不是让每个团队自行构建上下文压缩、缓存、重试和会话管理。
- 视频区分了 Claude 托管代理与自托管 Agent SDK 模式:托管代理提供的是服务端运行时,而不只是框架。
- 将代理循环与工具执行解耦,可以在模型推理和敏感运行时凭据之间形成更清晰的边界。
- 演讲者提到,通过消除每个会话的容器启动开销,P95 首 token 返回时间改善超过 90%。
- 自带计算资源支持让团队在私有基础设施内运行工具环境,但操作边界仍需验证。
- 演讲者的内部运行器示例说明,托管编排必须随模型行为演进,而不是固化某一代模型的特定行为。
- 工作坊使用结构化事件日志记录用户消息、工具输出和工作区状态,而不是把代理当作无状态请求响应端点。
- SRE 演示通过 Files API 摄取系统日志,并调用自定义基础设施工具来诊断数据库连接池耗尽。
- 空闲、运行、重新调度和终止等会话状态,让长时间运行代理的生命周期行为更明确。
- 结尾部分介绍了高级原语,包括子代理编排、记忆整理、用于凭据的加密 Vault 凭证库、Webhook 触发和评估规则。
构建者启发
- 当平台可以负责持久性、扩缩容和会话状态时,把重复的编排工作移入托管代理配置。
- 在服务端推理循环和执行工具的私有计算环境之间设计清晰边界。
- 将产品遥测数据建模为工作区事件,让团队能随时间调试代理状态、工具输出和用户操作。
- 当代理需要有依据的运行上下文时,将文件、日志、追踪和运行时产物输入工作区。
- 谨慎使用自动评估规则和记忆工作流;把自我改进当作可审计的产品循环,而不是神奇自治能力。
待验证事项
- Claude 托管代理和 Claude Opus 4.7 的正式可用性、区域支持、方案资格和定价。
- 自带计算容器的配置要求、运行时限制和网络约束。
- Vault 凭证的安全边界、加密保证、审计行为和企业合规状态。
- MCP 隧道、防火墙规则和私有基础设施连接如何配置和监控。
- 会话、工作区事件、文件、日志和派生记忆的数据保留与删除语义。
- 记忆整理和其他高级原语的延迟、成本、评估开销和失败模式。
