用 Codex 生成过图片的人应该都有一个体会,描述位置是真的烦。

「左上角加个 logo」,它给你贴到正中间。「背景换成海边」,它把前景也一起换了。你脑子里的画面很清楚,但翻译成提示词的时候,空间关系全丢了。

来回改三四轮,额度烧了一堆,图还是不对。

最近刷到一个开发者 @zhongerxin 做的 Codex 插件叫 Cowart,思路很简单:给 Codex 加一块无限画布,让你直接在图上画箭头、写批注,AI 看着标注改图,箭头指到哪,它就改到哪。

我自己装上试了一圈,把安装流程和实际使用踩过的坑整理出来,给同样想玩的朋友一个参考。

Cowart 是什么

先说底层。Cowart 基于 tldraw 搭建。

tldraw 是一个跑在浏览器里的开源无限白板,基于 React 构建,支持压感绘图、几何图形、富文本、箭头、形状吸附、图片视频嵌入和导出。开发者可以在它上面自定义形状和工具,做成各种画布应用。

Cowart 做的事情就是把 tldraw 接进了 Codex 的插件体系。用户在画布上画标注,Codex 通过 MCP 工具读取画布状态,生成或修改图片后再插回画布。整个过程不离开 Codex 对话窗口。

tldraw 的 GitHub 地址:github.com/tldraw/tldraw
Cowart 的 GitHub 地址:github.com/zhongerxin/cowart.git

安装步骤

安装不需要手动操作,直接把下面这段话复制粘贴到 Codex 对话框,让它自己装:

请从 github.com/zhongerxin/… 安装 Cowart Codex 插件。
请 clone 仓库到 ~/plugins/cowart,确认 .codex-plugin/plugin.json 存在,把插件加入 personal marketplace,先运行 codex plugin marketplace add ~,再运行 codex plugin add cowart@personal。安装后请校验插件,并告诉我是否需要开启一个新对话来加载新技能和 MCP 工具。

Codex 会自动跑完 clone、注册、校验的流程。装完之后,通常需要开一个新对话,让新加载的 skill 和 MCP 工具生效。这一步别跳过,不然画布功能可能调不出来。

使用流程

安装成功后,在 Codex 对话里输入:

帮我打开 Cowart 画布

Codex 会启动一个本地网页服务,对话里会给出画布的预览入口,点进去就是一块空白画布。

接下来的操作分两步走。

第一步,先让 Codex 生图。比如输入:

帮我生成一张达芬奇原汁原味风格的《蒙娜丽莎》油画

Codex 生成图片后会自动放进画布。

第二步,在画布上做标注。比如在人物眼睛的位置画一个箭头,旁边写上「给眼睛戴上墨镜」;在手部位置再画一个箭头,写上「手里拿着一杯果汁」。标注完成后,把画布截图发给 Codex,输入:

使用我的 Cowart 标注截图,生成一张干净的修订版图片,并将它放在原图旁边

Codex 会根据截图上的箭头和文字,理解每个修改对应的具体位置,然后生成修订版。

这套流程用在商品图制作上也很顺手。

比如让 Codex 生成一个极简风格的咖啡杯放在木桌上,然后在画布的背景区域标注「背景换为露营地」,在杯身中间标注「加上一个柴犬 logo」,截图发给 Codex 就行。

实际体验中的几个坑

说完好的,也得说说现阶段的问题,免得上手就劝退。

响应速度偏慢。从打开画布到生成图片、再到读取标注和修改,每一步都需要等。

额度消耗明显。每次生图和修图都在烧 token,反复迭代几个版本下来,消耗肉眼可见地涨。

偶尔会断联。画布、本地服务和 MCP 工具之间的同步不是每次都稳定。有时候 Codex 会读不到画布上的选区,或者插入结果失败。

遇到这种情况,重开画布或者重启对话基本能解决。

目前 Cowart 还是早期状态,适合尝鲜和探索,离日常生产力工具还有距离。

不只是 Codex 能用

Cowart 这套「画布 + 标注 + 生图」的交互逻辑,并不是只能跑在 Codex 上。只要 Agent 客户端能调用本地 MCP 工具、能访问本地画布服务、能使用图像生成能力,类似的玩法就可以迁移。

开发者 @tllll64 做了一个 WorkBuddy 的适配版本,G

itHub 地址:github.com/tllll64/cowart_workbuddy,有兴趣的可以试试。

最后总结一下:

对话框是线性的,但很多创作场景天然是空间性的。你想改一张图的某个局部,用文字描述位置永远不如直接在图上指一下来得准确。Cowart 现在做的事情虽然粗糙,但方向很明确:让 AI 不只听你说,还能看你指。

往后看,画布、表格、邮件、代码仓库这些桌面环境如果都能被 Agent 理解和调用,Codex 就不只是一个写代码的工具,而是一个可以不断加装能力的本地工作台。

其他阅读:

Windows 安装 Codex APP 失败怎么办?离线安装轻松解决!

亲测可用!零魔法,国内也能丝滑注册、订阅 Claude

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐