Codex 效率提升 10 倍的技巧：OpenAI 官方最佳实践拆解

官方文档写到，Codex app 的 Automations 可以选择项目、prompt、运行频率和执行环境，也可以选择在独立 git worktree 或本地环境里运行。你让 Codex “修好并验证”，但项目依赖装不起来、测试命令没告诉它、权限又不允许写文件，那它最多只能给你建议。如果你自己也没想清楚，甚至可以反过来让 Codex 采访你：让它先追问需求、挑战假设，把模糊想法压成可执行任务。O

迷渡

311人浏览 · 2026-05-28 20:34:14

迷渡 · 2026-05-28 20:34:14 发布

很多人用 Codex 的方式，还是一句话丢过去：“帮我改一下这个 bug。”

这当然能用，但很浪费。OpenAI 在 Codex 最佳实践里给出的核心判断很明确：Codex 更适合被当成一个会随项目逐渐配置和改进的队友，而不要把它当成一次性问答助手。

这句话背后的意思是：你不能只给需求，还要给上下文、规则、环境和验收标准。

1. 提示词最少要交代四件事

OpenAI 建议，一个默认可用的 Codex 任务提示，至少包括四块：

• 目标：你要改什么、做什么
• 上下文：哪些文件、目录、文档、报错和例子相关
• 约束：要遵守哪些架构、风格、安全或兼容约束
• 完成标准：什么状态算完成，比如测试通过、行为改变、bug 不再复现

这四项很朴素，但能减少大量误判。

差的提示是：

这个页面有问题，修一下。

更好的提示是：

修复订单详情页在移动端底部按钮遮挡内容的问题。相关文件是 OrderDetail.tsx 和 order.css。不要改接口，不要影响桌面端布局。完成标准：移动端 375px 和 414px 宽度下按钮不遮挡正文，现有单测通过。

使用 Codex 时，如果你不给边界，它只能猜。

2. 复杂任务先计划，不要急着写代码

OpenAI 的建议是：复杂、模糊、难描述的任务，先让 Codex 计划，再实现。

计划阶段至少能做三件事：

• 先读代码，确认真实入口
• 把任务拆成可检查的小步骤
• 提前暴露风险和需要确认的地方

Codex 里可以用 Plan mode。官方文档写到，Plan mode 会让 Codex 先收集上下文、提问、形成更强的计划，再进入实现；入口是 /plan 或 Shift + Tab。

如果你自己也没想清楚，甚至可以反过来让 Codex 采访你：让它先追问需求、挑战假设，把模糊想法压成可执行任务。

3. `AGENTS.md` 是项目说明书，不是装饰文件

一旦某套提示词反复用，就不要每次手写。OpenAI 建议把这类长期规则放进 AGENTS.md。

官方对它的定位很具体：AGENTS.md 是面向 agent 的开放格式 README，会自动进入上下文，适合写项目里希望 Codex 长期遵守的工作方式。

一个有用的 AGENTS.md 通常包括：

• 项目目录结构和关键目录
• 如何启动项目
• build、test、lint 命令
• 工程约定和 PR 要求
• 禁止事项和边界
• 什么叫完成，如何验证

CLI 里可以用 /init 生成一个初始 AGENTS.md，但官方也提醒：生成后应该按团队真实的构建、测试、评审和发布方式修改。

还有一个容易忽略的细节：AGENTS.md 可以分层。全局文件可以放在 ~/.codex，仓库根目录可以放共享规则，子目录也可以放更具体的规则；距离当前目录更近的规则优先。短、准、可执行，比长篇原则更有用。

4. 很多“AI 不靠谱”，其实是环境没配好

OpenAI 把配置单独列成一节，是有原因的。

Codex 的一致性，依赖项目环境：

• 模型选择
• reasoning effort
• sandbox
• approval policy
• profiles
• MCP 配置

以上这些都会影响它能做什么、做到哪一步、什么时候需要你确认。

官方建议的配置分层是：

• 个人默认值放在 ~/.codex/config.toml
• 仓库特定行为放在 .codex/config.toml
• CLI 命令行覆盖只用于一次性场景

文档还特别提到，很多质量问题本质是 setup 问题：工作目录不对、缺写权限、模型默认值不对、缺工具或连接器。

这点很真实。你让 Codex “修好并验证”，但项目依赖装不起来、测试命令没告诉它、权限又不允许写文件，那它最多只能给你建议。

5. 让 Codex 跑完验证闭环

OpenAI 不建议仅仅使用“让 Codex 改代码”。更好的闭环是：

• 必要时写测试或更新测试
• 运行相关测试套件
• 检查 lint、format、type check
• 确认最终行为符合请求
• review diff，找 bug、回归和风险模式

这也是 AGENTS.md 的价值所在：把“哪些检查必须跑”写进去，Codex 才知道什么叫完成。

Codex 还有 /review 命令，可以按 base branch、未提交改动、某个 commit 或自定义规则做 review。对团队来说，把 code_review.md 挂到 AGENTS.md 里，也能让评审标准更稳定。

一句话：让 Codex 解释、验证、审查自己的改动。

6. MCP、Skills、Automations 分别解决三类问题

这三个概念容易混在一起，但边界其实清楚。

MCP 解决“外部上下文”。

当 Codex 需要的信息不在仓库里，或者数据经常变化，就适合用 MCP。官方把 Model Context Protocol 定义为连接 Codex 与外部工具、系统的开放标准。Codex 支持 STDIO 和 Streamable HTTP server，并支持 OAuth。

Skills 解决“重复方法”。

当你反复使用同一段提示词、同一套流程、同一类检查，就应该沉淀成 Skill。Skill 用 SKILL.md 包装说明、上下文和必要逻辑，可在 CLI、IDE extension 和 Codex app 中使用。官方建议一个 Skill 只解决一个明确工作，先从 2 到 3 个具体用例开始。

Automations 解决“固定节奏”。

当一个流程已经稳定，可以让 Codex 在后台按计划跑。官方文档写到，Codex app 的 Automations 可以选择项目、prompt、运行频率和执行环境，也可以选择在独立 git worktree 或本地环境里运行。

一个简单判断是：Skills 定义方法，Automations 定义时间。

如果一个任务还需要你频繁纠偏，先别自动化。先把它做成稳定 Skill，再考虑定时跑。

7. 长任务要按任务开线程，不要按项目开线程

Codex 的会话是会累积上下文、决策和动作的工作线程。

官方建议是：一个清晰任务一个线程。不要把一个项目长期混在一个线程里，否则上下文会越来越膨胀，质量会下降。

CLI 里几个命令值得记：

• /resume：恢复保存的会话
• /fork：在保留原始 transcript 的前提下开新线程
• /compact：长线程压缩上下文；Codex 也会自动 compact
• /status：查看当前会话状态

如果任务分叉了，用 fork。任务还在同一个问题里，就留在原线程，保留推理轨迹。

最后给一个实用清单

下次开一个新任务，可以直接按这个顺序走：

1. 写清目标、上下文、约束和完成标准的提示词。
2. 复杂任务先 /plan，让 Codex 读代码和拆步骤。
3. 把项目规则写进 AGENTS.md，包括测试和验收方式。
4. 用 config.toml 配好个人默认值和仓库规则。
5. 要求 Codex 跑测试、检查格式、review diff。
6. 外部系统用 MCP，重复流程做 Skill，稳定周期任务再做 Automation。
7. 一个任务一个线程，长任务必要时 fork 或 compact。

Codex 的上限不只取决于模型，也取决于你有没有把工程上下文、项目规则和验证路径交给它。

把它当许愿池，结果就看运气。

把它当队友，就要给任务、给规则、给环境，也要让它交付可验证的结果。

参考资料

• OpenAI Developers：《Codex Best practices》
https://developers.openai.com/codex/learn/best-practices

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

本周 GitHub 热门项目推荐：Headroom 和 CC Switch

AI编程社区

我用Codex开发的第一个朋友圈九宫格素材小程序上线啦

AI编程社区

“聊天已死”！ChatGPT史上最大改版：告别纯聊天，转型“超级应用“押注AI智能体

特征说明一站式聊天+编程+图像+智能体+第三方应用主动执行不是等你提问，而是主动帮你完成任务生态开放接入外部应用，构建平台企业级面向企业客户提供任务自动化方案持续运行不是一问一答，而是7×24持续工作“聊天已死”：AI只用来聊天的时代结束了，未来是执行任务的智能体Codex上位：编程工具从附属功能升级为核心引擎超级应用：对标微信/支付宝的AI超级应用范式IPO驱动：8500亿估值+年内上市→必须证