Codex 无限画布插件 Cowart 使用教程:让 AI 改图「指哪打哪」
用 Codex 生成过图片的人应该都有一个体会,描述位置是真的烦。
「左上角加个 logo」,它给你贴到正中间。「背景换成海边」,它把前景也一起换了。你脑子里的画面很清楚,但翻译成提示词的时候,空间关系全丢了。
来回改三四轮,额度烧了一堆,图还是不对。
最近刷到一个开发者 @zhongerxin 做的 Codex 插件叫 Cowart,思路很简单:给 Codex 加一块无限画布,让你直接在图上画箭头、写批注,AI 看着标注改图,箭头指到哪,它就改到哪。
我自己装上试了一圈,把安装流程和实际使用踩过的坑整理出来,给同样想玩的朋友一个参考。
Cowart 是什么
先说底层。Cowart 基于 tldraw 搭建。
tldraw 是一个跑在浏览器里的开源无限白板,基于 React 构建,支持压感绘图、几何图形、富文本、箭头、形状吸附、图片视频嵌入和导出。开发者可以在它上面自定义形状和工具,做成各种画布应用。

Cowart 做的事情就是把 tldraw 接进了 Codex 的插件体系。用户在画布上画标注,Codex 通过 MCP 工具读取画布状态,生成或修改图片后再插回画布。整个过程不离开 Codex 对话窗口。
tldraw 的 GitHub 地址:github.com/tldraw/tldraw
Cowart 的 GitHub 地址:github.com/zhongerxin/cowart.git
安装步骤
安装不需要手动操作,直接把下面这段话复制粘贴到 Codex 对话框,让它自己装:
请从 github.com/zhongerxin/… 安装 Cowart Codex 插件。
请 clone 仓库到 ~/plugins/cowart,确认 .codex-plugin/plugin.json 存在,把插件加入 personal marketplace,先运行 codex plugin marketplace add ~,再运行 codex plugin add cowart@personal。安装后请校验插件,并告诉我是否需要开启一个新对话来加载新技能和 MCP 工具。
Codex 会自动跑完 clone、注册、校验的流程。装完之后,通常需要开一个新对话,让新加载的 skill 和 MCP 工具生效。这一步别跳过,不然画布功能可能调不出来。
使用流程
安装成功后,在 Codex 对话里输入:
帮我打开 Cowart 画布
Codex 会启动一个本地网页服务,对话里会给出画布的预览入口,点进去就是一块空白画布。

接下来的操作分两步走。
第一步,先让 Codex 生图。比如输入:
帮我生成一张达芬奇原汁原味风格的《蒙娜丽莎》油画
Codex 生成图片后会自动放进画布。

第二步,在画布上做标注。比如在人物眼睛的位置画一个箭头,旁边写上「给眼睛戴上墨镜」;在手部位置再画一个箭头,写上「手里拿着一杯果汁」。标注完成后,把画布截图发给 Codex,输入:
使用我的 Cowart 标注截图,生成一张干净的修订版图片,并将它放在原图旁边

Codex 会根据截图上的箭头和文字,理解每个修改对应的具体位置,然后生成修订版。

这套流程用在商品图制作上也很顺手。
比如让 Codex 生成一个极简风格的咖啡杯放在木桌上,然后在画布的背景区域标注「背景换为露营地」,在杯身中间标注「加上一个柴犬 logo」,截图发给 Codex 就行。

实际体验中的几个坑
说完好的,也得说说现阶段的问题,免得上手就劝退。
响应速度偏慢。从打开画布到生成图片、再到读取标注和修改,每一步都需要等。
额度消耗明显。每次生图和修图都在烧 token,反复迭代几个版本下来,消耗肉眼可见地涨。
偶尔会断联。画布、本地服务和 MCP 工具之间的同步不是每次都稳定。有时候 Codex 会读不到画布上的选区,或者插入结果失败。
遇到这种情况,重开画布或者重启对话基本能解决。
目前 Cowart 还是早期状态,适合尝鲜和探索,离日常生产力工具还有距离。
不只是 Codex 能用
Cowart 这套「画布 + 标注 + 生图」的交互逻辑,并不是只能跑在 Codex 上。只要 Agent 客户端能调用本地 MCP 工具、能访问本地画布服务、能使用图像生成能力,类似的玩法就可以迁移。
开发者 @tllll64 做了一个 WorkBuddy 的适配版本,G
itHub 地址:github.com/tllll64/cowart_workbuddy,有兴趣的可以试试。
最后总结一下:
对话框是线性的,但很多创作场景天然是空间性的。你想改一张图的某个局部,用文字描述位置永远不如直接在图上指一下来得准确。Cowart 现在做的事情虽然粗糙,但方向很明确:让 AI 不只听你说,还能看你指。
往后看,画布、表格、邮件、代码仓库这些桌面环境如果都能被 Agent 理解和调用,Codex 就不只是一个写代码的工具,而是一个可以不断加装能力的本地工作台。
其他阅读:
更多推荐



所有评论(0)