Builders Unscripted：Alchemy 的智能体开发循环

OpenAI 与 Alchemy 产品负责人 Matias Castello 讨论 Codex app 工作流、自动代码审查、共享 skills、Linear 自动化和个人语音到代码循环。

处理日期：2026 年 5 月 30 日

信息图展示 Alchemy 智能体工作流，从共享 skills 到 Linear 规划、功能开关和语音到代码更新。

执行摘要

Alchemy 产品负责人 Matias Castello 说明，工程团队和个人工作流如何使用 Codex app server、自动代码审查和模块化多智能体功能生成来减少部署瓶颈。

由生成式模型驱动的自动代码审查循环，能够在进入生产前发现复杂迁移错误和竞态条件。

软件开发范式正在转向把 AI agents 和自治执行者视为开发者基础设施与平台的直接消费者。

通过预先建立结构化偏好画像，构建者可以编排自治 AI agents，在夜间完成竞品研究并生成带功能开关的实验。

关键要点

Alchemy 最早的 AI 落地从 Slack 集成的自动文档编辑开始，用来绕过复杂的本地站点生成流程。
事后测试显示，Codex 能在大型迁移复盘中识别棘手且影响很大的竞态条件。
工程团队工作流演进为直接在 GitHub pull request 评论中进行交互式、来回迭代的调试。
公司级共享 AI skills 仓库让不同组织职能都能复用内部生产力能力。
一个个人 macOS 与 iOS 写作助手应用由 Codex app server 构建，并由活跃的 ChatGPT 订阅支撑。
Linear 项目管理流程被自动化，将 backlog 生成、任务拆解和执行跟踪委派给 LLM。
自定义 Apple Watch complication 用于捕捉简短语音，转写后把精确的代码仓库更新路由到正确位置。

构建者启发

默认把从零到一的工程任务视为 AI 可完成，而不是立即假设需要多人原型团队。
把个人和团队工作流收敛到类似 agents.md 的单一配置文件中，明确 agents 的架构边界。
把基础设施和 API 设计转向面向自治机器 agents 的直接消费场景。
使用多模型提示循环，通过跨模态图像到代码的迭代步骤自动生成 UI 变体。
当 LLM 产出异常或质量不足时，把问题视为人到 agent 沟通方式的优化问题。

待验证事项

确认本地文本扩展 hook 通过实时 Codex app server 运行时的结构一致性和错误率。
评估 Codex CLI 与 Codex harness 处理高频多文件迭代时引入的延迟开销。
核实把第三方客户端会话指向 ChatGPT API 后端时的真实定价和 credit 消耗结构。
评估要求研究 skill 从开放网页抓取竞品功能时产生模型幻觉的可能性。