Codex快速入门了解指南
一、Codex 是什么?为什么说它是 Agent?
OpenAI 的 Codex 是一款面向软件开发的 AI Agent。它与 ChatGPT 共用同一套账号与订阅体系,并针对编程任务使用专门优化的 Codex 模型;产品形态与目标则不同:ChatGPT 以对话为主,Codex 以在项目里完成任务为主。称 Codex 为 Agent,是因为它不仅能生成文字,还能在授权范围内读取代码、修改文件、执行命令、根据结果继续调整,直到任务推进到可验收的状态。
使用 Codex 通常需要 ChatGPT 订阅(如 Plus、Pro、Business 等,具体以 OpenAI 当前政策为准)。
1.1 ChatGPT 负责告诉你怎么做,Codex 可以直接帮你做
用 ChatGPT 写程序,常见流程是:你提问 → 模型给出思路或代码片段 → 你自己复制到编辑器、保存、安装依赖、运行、看报错,再回来继续问。模型停留在「建议层」,不会直接改动你本机项目目录里的文件。
Codex 则把「建议」和「执行」连在一起。你描述目标后,Agent 可以:
- 打开并编辑项目中的多个文件
- 在终端运行构建、测试、安装等命令
- 根据命令输出或报错信息继续修改
- 在需要时向你确认是否执行敏感操作
因此,两者的分工可以这样理解(以下对比主要指在本机项目里写代码的典型场景):
| ChatGPT | Codex | |
|---|---|---|
| 核心角色 | 顾问、讲解员 | 执行者、协作者 |
| 输出形式 | 主要是文字与代码块 | 项目内的实际变更与运行结果 |
| 是否改本机项目文件 | 否 | 是(Local / Worktree 等本地模式) |
| 是否在项目终端替你跑命令 | 否 | 是(本地模式下) |
ChatGPT 告诉你怎么做;Codex 在你指定的范围内,直接帮你做。
补充说明:Codex 也有 Cloud(云端) 模式——任务在 OpenAI 配置的远程环境中运行,变更以 diff 形式交给你审阅后再应用到本机,这与「ChatGPT 只给建议」仍不同,但也不是立刻改本地文件。网页版 Codex(Codex Web)同样属于云端工作流。
1.2 Codex 的工作对象不是单条消息,而是一个项目
普通聊天产品的上下文,往往围绕「当前这一轮对话」。你换话题或开新会话,之前的细节容易丢失,模型也很难对「整个仓库」形成稳定认知。
Codex 的设计单位是项目——通常是你选定的一个文件夹、Git 仓库,或云端绑定的代码环境。Agent 在这个边界内工作:搜索文件、理解目录结构、对照现有代码风格再动手。一次任务往往对应一条线程(Thread),可以在多轮对话里逐步完成,而不必每轮都重述背景。
这意味着:
- 上下文更完整:Agent 能同时参考多个文件,而不是只看你粘贴的一小段代码。
- 任务可拆分、可延续:可以先搭框架,再补测试,再改文档,在同一线程里推进。
- 结果可核对:改动落在真实文件或可应用的 diff 上,你可以用 diff、测试、运行程序来验收,而不是只读一段生成的文字。
用 Codex 时,更有效的说法不是「写一段 Python」,而是「在这个项目里,给登录模块加上单元测试并跑通」——把项目当作协作对象,而不是把模型当作一次性问答工具。
1.3 Codex 适合做什么?
Codex 适合有明确交付物、能在项目里验证的开发工作。
比较适合
- 从零或从模板搭建小项目、脚本、网页、API 服务
- 根据报错或现象定位并修复 bug
- 重构:拆文件、重命名、统一风格、补类型或注释
- 编写或更新 README、配置文件、CI 脚本
- 批量、重复性的代码调整(在人工审查前提下)
- 分步骤实现中等规模需求(先规划再执行)
不太适合或需谨慎
- 纯聊天、泛知识问答、与代码无关的写作——ChatGPT 往往更合适
- 没有可运行环境、无法验证结果的任务
- 未经审查就大规模改动生产环境或敏感数据
- 期望「一句话完美上线」且零人工检查的高风险变更
简单判断:能在文件夹里看到改动、在终端或浏览器里看到结果的,就适合交给 Codex。
二、Codex 的几种使用方式
Codex 提供多种入口,底层是同一类 Agent 能力;CLI、桌面 App 与 IDE 扩展还共享配置文件(如 ~/.codex/config.toml)和 MCP 设置。差别主要在于你在哪里操作、代码改在本机还是云端、是否图形化。
2.1 Codex CLI
Codex CLI 是 OpenAI 提供的开源命令行 Agent(Rust 实现),在终端里运行。进入项目目录后执行 codex,会进入交互式终端界面(TUI);用自然语言描述任务后,Agent 可在当前目录读写文件、执行 shell 命令。支持 macOS、Windows 与 Linux。
特点
- 轻量,不依赖图形界面
- 适合习惯命令行、远程 SSH、WSL、无桌面环境的服务器
- 便于与 Git、现有脚本配合;可通过
exec等能力接入自动化流程 - 支持 MCP、子 Agent 并行、本地代码审查等扩展能力
典型用法
- 在仓库根目录让 Agent 修 bug、补测试、跑测试套件
- 快速生成小型工具或脚手架
- 在 feature 分支上改代码,再用
git diff人工审查后提交 - 从 CLI 发起 Codex Cloud 任务,在终端审阅并应用远程 diff
使用 CLI 时同样要注意命令执行与审批模式:重要项目建议先纳入版本控制,再让 Agent 动手。
2.2 Codex 桌面客户端
Codex 桌面端是安装在 Windows 或 macOS 上的独立应用(官方称 Codex app)。用户选择一个本地文件夹作为项目,在图形界面里与 Agent 对话,并可查看代码变更、使用集成终端、并行管理多条线程等。会话与配置可与 CLI、IDE 扩展互通。
特点
- 可视化界面,适合不熟悉纯终端工作流的用户
- 支持多种运行模式:Local(直接改当前目录)、Worktree(在 Git worktree 中隔离修改)、Cloud(在远程环境运行)
- 支持查看 diff、Skills(技能)、Automations(自动化)等能力
- 可同时处理多个线程,分别推进不同任务
典型用法
- 初学者:选一个空文件夹,用 Local 模式从零做出可运行的小程序
- 日常开发:绑定现有项目,一条线程完成一个功能或一次修复
- 需要对照界面审查改动、边看 diff 边继续提需求时
桌面端强调「选文件夹 → 提需求 → 看改动 → 验收」,是上手 Codex Agent 的常见方式之一。
2.3 Codex 网页版和 IDE 插件
除 CLI 和桌面 App 外,Codex 还可通过浏览器和编辑器扩展使用。
网页版(Codex Web)
在浏览器访问 chatgpt.com/codex(需 ChatGPT 账号登录)即可使用 Codex Web。任务在云端环境中运行,适合:
- 临时换设备、不想安装客户端
- 更习惯在浏览器里管理 Agent 任务
- 本地机器资源有限,希望把构建与测试放在远程环境
云端完成后,你需要审阅并应用 diff,变更才会进入本机仓库——这与 Local 模式「直接改文件夹」的体验不同。
IDE 插件
OpenAI 提供 Codex IDE Extension,支持 VS Code 及其衍生编辑器(如 Cursor、Windsurf),以及 JetBrains 系列(IntelliJ、PyCharm、WebStorm 等)。Agent 出现在编辑器侧边栏,能利用当前工作区作为项目上下文:读文件、改代码、解释诊断信息。扩展同样支持将任务委托给 Codex Cloud,并在 IDE 内与桌面 App 同步线程(同一项目下)。
典型用法
- 写代码时顺手让 Agent 补测试、解释报错、做小范围重构
- 在 IDE 内直接应用或审查 diff,与调试、Git 插件一起使用
- 在编辑器与桌面 App 之间切换,延续同一线程
如何选择
| 方式 | 更适合 |
|---|---|
| CLI | 终端用户、远程机、脚本化、Linux 服务器 |
| 桌面客户端 | 需要完整 UI、本地项目管理、多线程并行、可视化 diff |
| 网页版(Codex Web) | 少安装、跨设备、云端构建与长任务 |
| IDE 插件 | 已在编辑器里开发、希望不离 IDE |
多种入口可以并存:日常小改用 IDE 插件,较大任务用桌面端或 CLI,云端环境用 Codex Web。核心 Agent 能力一致,区别主要在交互界面以及代码改在本机还是云端。
小结
Codex 被称为 Agent,是因为它面向的是项目级任务,而不仅是单条消息:能读、能改、能跑、能根据反馈迭代。ChatGPT 擅长回答「怎么做」;Codex 擅长在授权范围内「帮你做到能验收」。CLI、桌面端、Codex Web 与 IDE 插件,是同一能力的不同入口——按你的习惯、操作系统与是否需要云端环境选择即可。
感兴趣想要尝试的小伙伴可以参考 Codex配置使用教程
更多推荐

所有评论(0)