返回 OpenAI 简报

Builders Unscripted:Alchemy 的智能体开发循环

OpenAI 与 Alchemy 产品负责人 Matias Castello 讨论 Codex app 工作流、自动代码审查、共享 skills、Linear 自动化和个人语音到代码循环。

处理日期:2026 年 5 月 30 日
信息图展示 Alchemy 智能体工作流,从共享 skills 到 Linear 规划、功能开关和语音到代码更新。

执行摘要

Alchemy 产品负责人 Matias Castello 说明,工程团队和个人工作流如何使用 Codex app server、自动代码审查和模块化多智能体功能生成来减少部署瓶颈。

由生成式模型驱动的自动代码审查循环,能够在进入生产前发现复杂迁移错误和竞态条件。

软件开发范式正在转向把 AI agents 和自治执行者视为开发者基础设施与平台的直接消费者。

通过预先建立结构化偏好画像,构建者可以编排自治 AI agents,在夜间完成竞品研究并生成带功能开关的实验。

关键要点

  • Alchemy 最早的 AI 落地从 Slack 集成的自动文档编辑开始,用来绕过复杂的本地站点生成流程。
  • 事后测试显示,Codex 能在大型迁移复盘中识别棘手且影响很大的竞态条件。
  • 工程团队工作流演进为直接在 GitHub pull request 评论中进行交互式、来回迭代的调试。
  • 公司级共享 AI skills 仓库让不同组织职能都能复用内部生产力能力。
  • 一个个人 macOS 与 iOS 写作助手应用由 Codex app server 构建,并由活跃的 ChatGPT 订阅支撑。
  • Linear 项目管理流程被自动化,将 backlog 生成、任务拆解和执行跟踪委派给 LLM。
  • 自定义 Apple Watch complication 用于捕捉简短语音,转写后把精确的代码仓库更新路由到正确位置。

构建者启发

  • 默认把从零到一的工程任务视为 AI 可完成,而不是立即假设需要多人原型团队。
  • 把个人和团队工作流收敛到类似 agents.md 的单一配置文件中,明确 agents 的架构边界。
  • 把基础设施和 API 设计转向面向自治机器 agents 的直接消费场景。
  • 使用多模型提示循环,通过跨模态图像到代码的迭代步骤自动生成 UI 变体。
  • 当 LLM 产出异常或质量不足时,把问题视为人到 agent 沟通方式的优化问题。

待验证事项

  • 确认本地文本扩展 hook 通过实时 Codex app server 运行时的结构一致性和错误率。
  • 评估 Codex CLI 与 Codex harness 处理高频多文件迭代时引入的延迟开销。
  • 核实把第三方客户端会话指向 ChatGPT API 后端时的真实定价和 credit 消耗结构。
  • 评估要求研究 skill 从开放网页抓取竞品功能时产生模型幻觉的可能性。