场景无外乎代码生成:检查仓库、改动文件、跑测试、开 Pull Request

Durable Threads(持久化线程) 是第一个关键能力。长时运行的 Codex 线程在多次会话中保持工作上下文。被固定的线程适合反复出现的工作流:首席运营助手线程、发布检查线程、文档审查线程、监控线程。这些是持久工作区而非短对话,Codex 可以随时间回溯它们,保留之前的决策、偏好和工作上下文,否则这些必须从头重建。Command+1 到 Command+9 的快捷键让固定线程的切换变得实际。

Voice Input(语音输入) 的价值在于它捕捉想法的粗糙版本——在想法被压缩为精确文字之前。语音输入特别适合含糊的开头:自然说出来容易,但打字却很尴尬的场景,比如"我在 Slack 上听一个叫 Ben 的人提过这件事,细节不记得了,请去查一下"。转录文本也同样有效——原始会议记录或口述计划笔记通常比简短摘要提供更好的素材,因为它保留了不确定性、强调和未完成的思考线索。

Steering 和 Queuing让语音与显式控制结合。Steering 是打断正在运行的任务,在当前步骤完成之前注入新方向;Queuing 是在当前任务之后排队下一个任务。两者都让用户在工作进行中保持近距离监控。

工具扩展是其第三个维度。Codex 可以逐层向外扩展:$browser 用于侧边栏应用内浏览器,Codex 可以检查和标注网页;@chrome 用于需要登录状态的工作;@computer 用于只有通过桌面 GUI 才能完成的工作。MCP 服务器和连接器进一步扩展到 Slack、Gmail、Calendar 等工作流——因为很多重要任务首先以消息、收件箱或日程问题的形态出现,远早于它们变成代码。

Automations让 Codex 可以在 schedule 上自动运行工作。线程自动化(Thread automation)是心跳式的周期性唤醒,返回同一线程继续工作。比如一个首席运营助手线程可以每 30 分钟检查 Slack 和 Gmail 中的未回复消息,帮忙优先排序,准备回复草稿——用户回来时,最费时的上下文收集已经完成。

Goals适合有明确终点线的长期任务,它定义成功标准,Codex 可以持续向这个目标推进。一个实用的 verifier 可以是测试套件、基准测试、Bug 复现、验证矩阵或必须持续通过的工作流。"雄心很重要,但没有验证的雄心只是愿望。"

Shared Memory让长时线程在单一对话之外共享记忆。将持久化线程锚定在 Obsidian 库中是实践方式——~/vault 作为持久工作内存,AGENTS.md 定义 Codex 应如何更新它学到的东西:把人、项目、决策、开放循环和日期链接存储下来。"重要的上下文不应该只存在于对话记录里,把它写下来,让下一个线程可以接上。"

参考:https://x.com/jxnlco/status/2057153744630890620

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐