OpenAI 的端午节礼物:Record & Replay
2026 年 6 月 19 日端午节,OpenAI 提前一天送了个礼物——随 Codex app 26.616 发布的 Record & Replay 功能。别人送礼送粽子,OpenAI 送礼送自动化。它让用户通过一次操作演示,自动生成可复用的 skill,后续由 Codex 自动执行。

说人话就是:你做一遍,它记住了,下次它自己来。你只管吃粽子。
一、功能定位
Record & Replay 解决一个核心问题:重复性操作需要反复用 prompt 描述。
过去让 Codex 执行重复任务,用户必须在 prompt 里逐步说明步骤、字段、规则。Record & Replay 将这个过程简化为:用户完整演示一次流程,Codex 观察并记录,然后自动生成一份结构化 skill。
官方将其定位为 skill 创建的新入口,与手写 SKILL.md 并列。

二、工作流程
Record & Replay 分为三个阶段:
Record(录制):用户在 Codex app 中点击 Record a skill,补充上下文 prompt 后开始录制。Codex 通过 Screen Recording 和 Accessibility 权限观察用户在 macOS 上的操作。流程完成后用户停止录制。
Distill(提炼):Codex 检查捕获到的操作和窗口内容,自动起草一份 skill 文件,包含:使用条件、输入参数、执行步骤、验证方式。生成结果为草稿(draft),并非最终版。
Replay(回放):用户在新线程中调用该 skill,提供本次变化的输入(如不同文件、日期),Codex 结合 Computer Use、browser actions 或插件执行流程。

三、与传统自动化的区别
传统宏或 RPA 工具记录的是固定坐标和固定 UI 元素路径,界面变化即失效。
Record & Replay 生成的 skill 是基于自然语言描述的工作流程文件。执行时 Codex 通过视觉理解识别当前界面状态,再按 skill 描述的步骤灵活执行。因此它对界面变化的适应能力优于固定脚本,但确定性低于传统代码自动化。
它的定位介于"人工操作 SOP"和"代码脚本"之间。

四、适用场景
官方建议的适用条件:重复发生、依赖个人偏好、演示比描述更容易、步骤稳定且成功标准清晰。
典型用例:
-
• 提交费用报销
-
• 预订停车位
-
• 创建配置好的 issue
-
• 发布视频
-
• 下载周期性报表并归档
不适合的场景:
-
• 一次性任务
-
• 高风险不可逆操作
-
• 需要大量隐藏业务判断的流程
-
• 需要强确定性、可审计、可回滚的核心生产操作
五、注意事项与风险
-
1. 单次演示过拟合:一次演示只覆盖一条顺利路径。文件已存在、登录过期、表单校验失败等分支不会自动纳入 skill,需要人工补充。就好比教人包粽子,你只演示了包成功的那个,没教他米漏了该怎么办。
-
2. 隐含偏好未被记录:演示时用户凭经验做出的判断(如命名规则、默认字段)不会自动写入 skill,需要后续补充。
-
3. 敏感数据暴露:录制依赖窗口内容观察,官方建议避免在录制中输入密码、token、客户隐私。想想看,端午节别人送你粽子,结果你把自己的密码也包进去了。
-
4. 平台限制:目前仅 macOS 可用,排除欧洲经济区、英国、瑞士。Windows 用户可能得先吃个粽子冷静一下。
-
5. Skill 治理问题:创建成本降低后可能出现 skill 膨胀——重复、过时、命名不清的 skill 累积,需要团队建立审查和淘汰机制。
-
6. 早期可用性:有用户反馈插件安装并授权后仍提示"Record & Replay is not enabled for this user",可能存在服务端 feature flag 控制。属于是粽子已经上桌了,但你的筷子还没到。

六、使用建议
录制前明确目标,使用低敏样例数据,只演示目标流程,到达成功状态后立即停止。录制后审查生成的 skill,至少补充输入参数、前置条件、失败分支、成功标准。上线前用不同输入验证多轮,高风险步骤添加人工确认。
团队使用时建议将 skill 纳入版本管理,指定 owner,记录 changelog,定期淘汰。
七、总结
Record & Replay 的核心价值不是"录屏回放",而是将人类的一次操作演示转化为可读、可改、可复用的 agent 工作说明。它降低了创建 skill 的门槛,但不会自动解决流程完整性问题。生成的 skill 是草稿,可靠性来自后续的人工审查、分支补充和验证。
参考来源:
-
• OpenAI Developers: Record & Replay
-
• OpenAI Developers: Codex changelog
-
• OpenAI Developers: Agent Skills
-
• OpenAI Developers: Computer Use
-
• Feng et al. Get Experience from Practice: LLM Agents with Record & Replay
-
• OpenAI Developer Community: Introducing Record & Replay
更多推荐

所有评论(0)