从 Prompt 到 Agent：如何用 Codex 打造一个真正能工作的海报设计数字员工（附 CC Switch 第三方 API 接入指南）

JJJennie777

487人浏览 · 2026-06-30 16:15:19

JJJennie777 · 2026-06-30 16:15:19 发布

大模型已经能够回答绝大多数问题，但真正落地到企业场景时，仅仅“会回答”远远不够。

以海报设计为例，一个完整的设计流程通常包括需求收集、信息校验、品牌规范匹配、视觉素材生成、排版输出、人工审核等多个环节。如果仅依赖一次对话，即使 Prompt 写得再长，也很难保证每一步都稳定执行，更无法形成可复用、可持续优化的生产流程。

这正是 Agent（智能体） 的价值所在。

Agent 并不是一个更长、更复杂的 Prompt，而是一套能够持续执行任务、调用工具、保存状态、处理异常并接受人工接管的工作流。它让 AI 从“回答问题”升级为“完成工作”。

本文将以海报设计数字员工为案例，介绍如何利用 Codex 与 Agent 六步法，将聊天机器人升级为真正能够完成工作的智能体，并介绍如何借助 CC Switch 接入第三方模型 API，构建更加灵活的 AI 工作流。

为什么传统聊天 AI 难以胜任海报设计？

假设市场部提交了这样一个需求：

**活动名称：**618 年中大促
**发布时间：**6 月 18 日
**尺寸：**1080×1920
**品牌色：**紫色
**风格：**科技感
**输出格式：**PNG

传统聊天 AI 往往会直接开始生成图片。

但真正的设计流程远不止如此。

一个成熟的设计团队通常还会检查：

活动信息是否完整？
是否缺少地点、时间或利益点？
是否符合品牌视觉规范？
Logo 是否正确？
字体是否符合品牌要求？
图片是否存在版权风险？
最终是否需要人工确认？

这些并不是模型能力的问题，而是流程管理的问题。

很多人在使用 AI 时，仍然停留在“优化 Prompt”的阶段，希望通过不断修改提示词，让模型一次性给出理想答案。但在企业场景中，真正重要的不是某一次回答是否精彩，而是每一次执行是否稳定、可追踪、可复用。

Agent 正是为了解决这个问题而诞生的，它的本质是你的同事。

开始之前：使用官方模型或让 Codex 接入你自己的模型

很多人第一次使用 Codex 时都会遇到一个问题：

Codex 默认按照 OpenAI Responses API 调用模型，而许多第三方模型（如 DeepSeek、通义千问等）仍采用 Chat Completions API。两者协议不同，因此不能直接替换 API 地址。

CC Switch 则可以作为一个本地协议转换层，帮助 Codex 无缝接入不同模型。

其工作方式可以理解为：

Codex
      │
Responses API
      │
      ▼
 CC Switch
      │
协议转换
      │
      ▼
DeepSeek / 通义千问 / 其他模型

这样，无需修改 Codex 本身，就可以灵活切换不同模型。

附：CC Switch 安装

1.打开 https://github.com/farion1231/cc-switch ，找到 Release。

2.往下翻到 Assets，Windows 选 msi，Mac 选 dmg

3.安装

配置步骤

Step 1 添加模型供应商

打开 CC Switch，点击右上角 "+" 添加新的模型供应商。注意本地路由映射这个开关要打开（设置界面记得打开codex路由）

填写：

Base URL
API Key

这里我们可以用官方API也可以用第三方API，

通过对比价格，稳定性，速度，安全四方面后，我决定选择第三方魔芋api平台来获取API key：

点击前往（用手机号或邮箱注册）魔芋AI大模型网关I全球大模型一站式调用及服务平台魔芋AI大模型聚合平台（大模型网关平台）专注于提供高效能、低成本的多品类 AI 模型服务，助力开发者和企业聚焦产品创新。https://www.moyu.info/register?aff=qBX9

2、注册成功后进入【令牌管理】

3、模型广场上复制要使用的模型ID

要配置moder ID时候要去模型广场复制名称。

我们可以前往模型广场查看全球主流模型。如果注册后前往模型广场没有看到想用的全球模型，可以联系客服，添加客服申请模型广场开白。有技术问题也可以联系客服进行解答。

分组不同可以设置在令牌管理那选择

获得API KEY，填写魔芋的baseURL:https://moyu.info/v1，完成后保存。

Step 2 配置模型映射

进入 Advanced Options → Model Mapping。

将 Codex 使用的模型名称映射到实际模型，例如：

gpt-4.1
        ↓
qwen-max

或者：

gpt-4.1
        ↓
deepseek-v3

之后，所有模型切换都可以在 CC Switch 中完成，而无需修改项目代码。

Step 3 开启本地路由

进入：

Settings
    ↓
Routing

开启全局路由。

默认监听地址：

127.0.0.1:15721

Step 4 在 Codex 中配置 Endpoint

最后，在 Codex 中修改模型 Endpoint：

http://127.0.0.1:15721

选择已经映射好的模型即可开始使用。

整个过程中，Codex 保持统一调用方式，而底层协议转换由 CC Switch 自动完成。

实战：用 Agent 六步法搭建海报设计数字员工

一个真正能够工作的 Agent，通常包含六个核心组成部分：角色（Role）、记忆（Memory）、任务（Workflow）、工具（Tools）、护栏（Guardrails）和评测（Evaluation）。

下面，我们以海报设计场景为例，逐步完成 Agent 的设计。

第一步：定义角色（Role）

角色决定了 Agent 的职责边界，而不是简单给它起一个名字。

建议采用"一句岗位说明 + 三项职责 + 三项禁区"的方式进行定义。

岗位说明

你是一名负责营销海报设计的视觉 Agent。

核心职责

解析设计需求并检查信息完整性；
根据品牌规范完成风格匹配和版式设计；
调用图片生成工具完成视觉素材制作。

禁止事项

不得擅自发布最终海报；
不得使用来源未知或存在版权风险的素材；
当需求信息缺失时，不得自行猜测，必须暂停流程并向用户追问。

通过明确职责边界，可以有效避免 Agent 越权决策或“自作聪明”。

第二步：建立记忆（Memory）

Agent 的记忆并不是简单堆积资料，而是保存完成任务所需要的长期知识和运行状态。

建议将记忆分为四类。

固定知识

例如：

品牌 Logo
品牌色
字体规范
设计模板
排版规范

用户信息

例如：

所属部门
面向人群
常用活动类型
输出尺寸偏好

当前任务状态

例如：

文案是否确认
素材是否齐全
当前执行到哪个步骤
是否等待人工审核

历史经验

例如：

历史优秀案例
被驳回原因
修改记录
常见错误

这些信息能够帮助 Agent 在不同会话之间保持一致性，而不是每次重新开始。

第三步：拆解任务（Workflow）

真正避免 Agent 跳步的方法，是把复杂工作拆解成连续、可验证的流程。

步骤	工作内容	异常处理
Step 1	检查需求是否完整	缺少信息立即停止并追问
Step 2	匹配品牌规范	无匹配模板时请求人工确认
Step 3	调用图片模型生成视觉素材	多次失败则转人工
Step 4	自动完成排版	字体溢出自动调整
Step 5	导出 PNG、PDF 或设计稿	导出失败重新执行
Step 6	等待人工审核	审核通过后结束流程

相比聊天机器人直接输出图片，这种流程最大的优势是：

每一步都有输入、有输出、有状态，也可以随时暂停、恢复或重新执行。

第四步：配置工具（Tools）

Agent 不只是一个模型，它需要借助工具完成真实工作。

一个完整的海报设计 Agent 通常会使用三类工具。

内容工具

用于读取：

活动需求
Word 文档
品牌规范
历史设计模板

生成工具

用于：

图片生成
文档生成
Markdown 输出
PPT 制作

检索工具

用于：

查询品牌资料
搜索设计参考
获取最新活动素材

在 Codex 中，这些工具通常通过插件（Plugin）、MCP 服务或 CLI 工具进行调用。

真正重要的不是工具数量，而是要明确：

什么情况下调用；
输入什么参数；
返回什么结果；
调用失败如何处理。

第五步：设置护栏（Guardrails）

Agent 必须知道哪些事情可以做，哪些事情不能做。

例如：

当出现以下情况时，应立即暂停流程：

涉及版权风险；
涉及人物肖像；
品牌信息冲突；
输出内容存在法律风险；
用户需求存在歧义。

此时 Agent 不应该继续生成，而应输出：

当前任务需要人工复核，请确认后继续执行。

这也是企业 Agent 与普通聊天机器人的重要区别。

第六步：建立评测（Evaluation）

一个优秀的 Agent，不会随着时间推移越来越混乱，而是越来越稳定。

建议建立持续评测机制。

例如准备：

3 个标准案例；
2 个故意缺失信息的异常案例；
2 个版权冲突案例；
若干历史失败案例。

每次执行完成后，记录：

哪一步失败；
为什么失败；
是否需要新增检查规则。

随后，把这些经验不断写回长期记忆。

Agent 的能力，也是在这样的循环中不断提升。

在 Codex 中固化你的 Agent

完成设计之后，就可以将这套规则真正运行在 Codex 中。

相比不断复制 Prompt，更推荐把规则写入项目中的 AGENTS.md。

例如：

# Role

你是一名品牌海报设计 Agent。

# Workflow

1.检查需求完整性
2.读取品牌规范
3.生成图片
4.完成排版
5.等待人工确认

# Guardrails

禁止发布最终图片
禁止修改品牌 Logo
禁止使用未知版权素材

# Output

PNG
PDF
Markdown 设计说明

以后，无论开启多少个新会话，Codex 都能够自动继承这些规则，而无需重复输入。

利用 Codex 管理复杂上下文

使用 `/compact` 保持上下文清晰

很多人误以为聊天越长，AI 就越聪明。

事实上，过长的上下文往往充满大量无关信息，容易让模型偏离当前任务。

当一个阶段结束后，可以执行：

/compact

Codex 会自动整理当前上下文，仅保留：

当前目标；
已完成工作；
关键决策；
下一步计划；
不可修改的约束。

这样不仅减少 Token 消耗，也能显著提升后续执行质量。

使用 Subagent 隔离探索任务

假设需要尝试二十种不同的排版方案。

如果全部放在主线程中，很快就会产生大量无效上下文。

更好的做法是：

Subagent A：探索不同配色；
Subagent B：尝试不同版式；
Subagent C：优化图片生成 Prompt。

主线程只保留最终确认的设计方案。

这样既保持上下文整洁，也方便后续继续推进项目。

利用 Appshots 快速定位问题

当排版软件出现图层错位、图片缺失或渲染异常时，可以使用 Codex 的 Appshots 功能快速截取当前窗口。

Agent 能够结合截图理解当前界面状态，定位问题并给出修复建议，而无需用户反复描述。

从聊天机器人到数字员工：完成 Agent 封装

当角色、流程、工具和规则都设计完成后，就可以将 Agent 封装成真正可工作的系统。

整体流程如下：

用户提交需求
        │
        ▼
    Agent 接收任务
        │
        ▼
读取 AGENTS.md
        │
        ▼
调用工具执行流程
        │
        ▼
输出设计结果
        │
        ▼
人工审核确认
        │
        ▼
正式发布

根据不同团队规模，可以选择不同的部署方式：