教程版：直接让 Codex 安装 jianying-editor，搭一条剪映自动化工作流

不大姐姐AI智能体

33人浏览 · 2026-06-20 17:50:40

不大姐姐AI智能体 · 2026-06-20 17:50:40 发布

在自媒体和视频内容创作中，很多人面临一个瓶颈：使用 AI 撰写文案非常迅速，但后续在剪映中手动拖拽素材、对齐音频和添加字幕，依然要消耗数小时的枯燥劳动。

本文将为你介绍如何通过 Codex 安装 jianying-editor 技能，直接打通 AI 与剪映的底层草稿协议，实现视频、口播、背景音乐和字幕的自动化全量装配。

在正式开始前，我们需要理清一个核心逻辑：jianying-editor 并不是安装在剪映内部的插件，而是安装在 Codex 中的一个全局技能（Skill）。

它的工作原理是：Codex 负责生成文案、规划分镜并准备素材，随后通过 Python 脚本调用 JyWrapper 接口，直接将这些数据写入剪映的草稿文件。

最后，你只需要打开剪映客户端，就能在熟悉的时间线上进行精修与导出。

---

一、jianying-editor 的核心能力

jianying-editor 是一个专为剪映设计的自动化剪辑工具，它绕过了模拟鼠标点击的低效方式，直接对剪映草稿的底层数据结构进行读写。

该工具主要提供以下六大核心能力：

草稿生命周期管理：支持新建、覆盖、克隆以及检查剪映的草稿项目。
多媒体素材导入：自动将本地的视频、图片、音频及云端素材导入项目，并精准安排其在轨道上的位置。
音频与文本联动：支持自动生成口播语音，并将对应的字幕与背景音乐（BGM）精准对齐。
视觉效果装配：支持在指定时间点添加标题、转场、滤镜、动画以及设定关键帧。
辅助工具链集成：可调用录屏、截图、智能变焦以及 Web 动效合成等外部工具。
轨道合规性检查：利用内置的 draft_inspector 检查视频、音频和字幕轨道的完整性，确保无片段重叠或缺失。

说白了，它就像是一座桥梁，把 Codex 的内容策划能力直接延伸到了剪映的时间线上。

---

二、在 Codex 中自动安装技能

打开你的 Codex 客户端，新建一个对话，将以下提示词完整发送给它：

请使用 skill-installer 安装这个 GitHub Skill：https://github.com/luoluoluo22/jianying-editor-skill.git
安装为全局技能 jianying-editor。安装完成后创建独立 Python 虚拟环境，安装 requirements.txt，安装 Playwright Chromium，设置 JY_SKILL_ROOT，并运行 api_validator.py 检查环境。最后告诉我安装目录和检查结果。

Codex 接收到指令后，会自动下载 Skill 源码，配置隔离的 Python 虚拟环境，并自动定位你电脑上的剪映草稿目录。

在执行过程中，如果系统弹出联网或终端执行权限的提示，请选择允许。

安装完成后，建议重启一次 Codex，以确保新技能已被正确加载到可用列表中。

为了让 Codex 在后续的文案策划、分镜设计以及多媒体参数生成中拥有更稳定的表现，我们需要为其配置高水准的模型服务。

本文使用 iThinkAPI 作为 OpenAI Compatible API 的演示环境，帮助大家完成底层的模型服务配置。

在 Codex 的模型服务配置或 API 登录界面，你可以参考以下配置块进行设置：

Base URL：https://token.ithinkai.cn/v1
API Key：YOUR_API_KEY
Model：以服务文档为准，最新模型 gpt-5.5、claude-opus-4-8、gpt-image-2 等可按文档查看；涉及图片生成时，以 0.05¥/图起、2k/4k 支持等服务文档说明为准。

iThinkAPI 配置环境示例

在正式连接前，请按照以下两个步骤完成模型与凭证的准备：

第二步：挑选模型与确定分组

在进行自动化配置前，我们需要登录服务平台进入模型广场。

利用 gpt、claude 或 image 等关键词检索符合我们视频生成任务的模型。

根据具体任务（如文案策划选择高逻辑模型，生图选择视觉模型）确认模型对应的分组与线路。

需要注意的是，同一个模型在不同分组下的调用成本、响应速度和可用状态可能会有所不同，具体请以页面展示和服务文档为准。

第三步：创建 API 令牌

确定好所需的模型和分组后，进入控制台的令牌管理页面。

点击添加令牌，并将其绑定到我们在第二步中选中的对应分组。

如果暂时不确定具体的模型限制，可以先将限制字段留空。

创建成功后，复制生成的 API Key，并返回到我们的 Codex 或自动化工具中，正确填写 API Key、Base URL 以及 Model 参数进行连接测试。

---

三、运行首个冒烟测试

环境配置完成后，我们可以通过一个简单的测试来验证链路是否通畅。

在 Codex 中发送以下指令：

请使用 jianying-editor 创建一个10秒测试草稿。加入测试视频、背景音乐和标题“Codex + 剪映测试成功”。保存后使用 draft_inspector 检查视频、音频和字幕轨道。

Codex 会在后台自动编写并运行 Python 脚本，将生成的草稿文件写入剪映的默认工程目录。

由于剪映客户端不会实时监听文件系统的变化，生成成功后，你需要重启剪映，或者在剪映中随意进入一个旧草稿再退出，此时草稿列表就会刷新。

打开刚刚生成的测试草稿，如果你能看到时间线上已经正确排列了视频片段、背景音乐和标题文本，说明基础环境已经完全跑通。

---

四、构建完整的口播视频工作流

在单点测试通过后，我们就可以尝试让 Codex 执行更复杂的视频装配任务。

你可以向 Codex 发送如下的复合指令：

使用 jianying-editor 制作一条教程口播视频。生成文案和分镜，调用我的声音，使用指定BGM，准备截图和录屏。添加字幕、转场和提示音，最后写入剪映草稿并检查轨道。

在实际执行中，Codex 会将这个复杂的任务拆解为以下四个步骤：

结构化文案生成：调用大语言模型，按照黄金三秒、痛点引入、解决方案、行动号召的结构生成口播文案。
语音合成（TTS）：将文案转化为音频文件，并精确计算每个语句的起止时间。
视觉素材准备：利用 FFmpeg 裁剪本地视频，或通过 Computer Use 截取指定的网页动效与软件操作画面。
时间线装配：将上述所有素材按照时间戳精准写入剪映草稿，并自动添加转场和音效。

这套方案的目的并不是完全取代人工剪辑，而是让 AI 承担起对齐素材、切片、加字幕等重复性极高的体力劳动。

视频的节奏微调、高级调色以及最终的导出，依然交由人类剪辑师来把控，从而实现效率与质量的双重提升。

---

五、主流视频自动化方案对比

在程序化生成视频的领域，除了 Codex + 剪映的组合外，Remotion 和 HyperFrames 也是非常热门的方案。

它们之间的核心差异如下：

如果你希望保留熟悉的剪映剪辑界面，方便随时手动微调，那么 Codex + 剪映 是最稳妥的选择。

如果你需要通过代码批量生产结构高度一致的数据图表视频，Remotion 会更加高效。

如果你追求极致的网页动效和视觉包装，则可以考虑 HyperFrames。

---

六、常见问题与排错指南

在配置和使用 jianying-editor 的过程中，你可能会遇到以下问题，可以按照以下方法进行排查：

1. 找不到剪映草稿路径（Draft Path Not Found）

不同操作系统和版本的剪映，其草稿默认存储路径有所不同。如果遇到路径报错，请手动确认以下路径是否存在：

macOS 默认路径：/Users/你的用户名/Movies/JianyingPro/User Data/Projects/com.lveditor.draft/
Windows 默认路径：C:\Users\你的用户名\AppData\Local\JianyingPro\User Data\Projects\com.lveditor.draft\

你可以在 jianying-editor 的配置文件中手动指定 JY_DRAFT_ROOT 环境变量来解决此问题。