量化交易不再需要你坐在键盘前：用 Loop Engineering 构建永不睡眠的自改进系统

紫微AI

16人浏览 · 2026-06-23 08:06:11

紫微AI · 2026-06-23 08:06:11 发布

大多数零售量化交易者还在做这件事：打开 Claude，输入一个提示，等待信号，阅读输出，然后再打下一个提示。

他们是循环本身。
Agent 只是一个工具，而他们必须全程坐在键盘前，决定每一步该做什么。

真正厉害的构建者早就停下了这种做法。
他们不再提示 Agent，而是编写让 Agent 自己提示、验证、决策并持续运行的循环。循环在你合上电脑后依然在工作。

Boris Cherny（Anthropic Claude Code 负责人）两周前说得很直白：“我已经不再提示 Claude 了。我有正在运行的循环，它们会提示 Claude 并自己决定下一步。我的工作就是编写这些循环。”

这句话把整个 AI 工程思维都重构了，尤其在量化交易这个领域。

量化交易本来就是一个循环：拉取数据 → 生成信号 → 回测 → 执行 → 风险监控 → 重复。
华尔街所有基金（Renaissance 从 1988 年就开始、Citadel、Two Sigma、Jane Street）都在跑这个循环。他们只是把几百个分析师和工程师塞进了循环里。

你不需要。
一个设计良好的自运行循环，就能让 solo builder 逼近甚至在某些维度超越那些需要数百人的机构。

Roan（@RohOnChain）已经为自己把这套系统完整跑起来了：定时拉数据、自主进行 alpha 研究、用独立 Agent 验证信号、只执行通过验证的交易、把每一次教训写回记忆。

下面是这套系统的完整拆解。

循环工程 vs 传统提示的本质区别

传统方式：你输入提示 → 读输出 → 根据输出再输入下一个提示。你是整个循环的执行者。

循环工程：你定义目标和停止条件，系统自己迭代。
Agent 会在单次运行中忘记上下文，但循环不会。状态、经验、教训会跨运行累积。

这才是 Boris 所说的“我的工作是写循环”——你从“实时操作员”变成了“系统架构师”。

在交易里，这意味着：不再为一笔交易手动提示，而是构建一个能跑几千次迭代、每次只进步 1%、永不睡觉的系统。

任何一个能稳定运行的循环都必须包含这六个组件

缺任何一个，循环都会悄无声息地失效。

Automation（自动化触发器）
循环的心跳。可以是 cron、webhook、/loop 命令或 Claude Code 里的 hook。
两种模式：/loop 按固定节奏重跑；/goal 则一直运行直到达到你定义的可验证条件（比如“回测 Sharpe > 1.5”）。
Skill（技能文件）
通常是 SKILL.md。里面写着你的交易规则、历史教训、避坑指南。
没有它，每次运行都从零开始；有了它，意图和经验就能复利累积。
State 文件（状态/进度文件）
通常叫 STATE.md 或 PROGRESS.md。
Agent 每次运行前读取它，运行结束后写回发生了什么。它是循环的记忆脊柱，也是事后审计日志（出问题时唯一能回溯的完整记录）。
Verifier（验证器）
生成信号的 Agent 是最差的裁判。
你需要一个完全独立的 Agent（最好用不同模型、不同指令），只负责验证。
这就是经典的 Maker-Checker 模式。华尔街 prop shop 内部都是这么干的：提出交易的人不批准交易。
Worktrees（工作树）
Git worktree 让多个 Agent 能同时对同一代码库工作，却各自在独立分支和目录里运行，避免冲突。
在交易系统里，你可以让信号研究、回测、风险监控并行跑，互不干扰。
Connectors（连接器）
基于 Model Context Protocol（MCP）的连接器，让循环能真正触达外部世界：调用经纪商 API、下单、查询数据库、发 Slack 通知等。
没有它，循环只能“建议交易”，不能真正执行。

这六个组件在 Claude Code、Codex 等所有成熟的 agentic 系统中反复出现，是通用底层。

如何把六个组件 wired 成一个完整的自改进量化交易系统

整个系统由五个子循环组成，每个子循环都有自己的 Skill、State 和 Verifier。

Stage 1: 数据摄取（Data Ingestion）
Automation 按固定频率触发（每分钟/每小时/每天）。数据写入共享 State 文件，供后续阶段读取。

Stage 2: 信号生成（Signal Generation）
这是 alpha 研究的核心。
Agent 读取 SKILL.md（里面包含你的 alpha 规则）。
每一次亏损或失败，都会把教训写回 SKILL.md，成为下一轮的新规则。这就是系统自我改进的机制。

Stage 3: 验证（Verification）
信号进入完全独立的验证 Agent。
验证器看不到生成时的推理过程，使用不同模型（例如生成用 Sonnet，验证用 Opus）。
未通过验证的信号直接被杀死。只有通过的才进入下一阶段。

Stage 4: 执行（Execution）
只有通过验证的信号才能到达这里。
通过 MCP 连接器直接调用经纪商 API，下单过程完全自动化（Auto mode）。

Stage 5: 风险监控（Risk Monitoring）
在独立的并行 worktree 中持续运行。
这是系统的“杀伤开关”，严格执行风控规则，不允许任何协商。

这五个子循环串联成一个闭环：数据进来 → 信号生成 → 验证 → 执行 → 风险监控 → 教训写回记忆 → 重新开始。

Roan 说：“我只设计了一次。从那之后，我就再也没有手动提示过任何一个步骤。”

停止条件必须是可验证的，而非 Agent 的自我宣称

循环最容易失败的地方就是这里。
Agent 经常在工作只完成一半时就发出“任务完成”的信号，导致循环退出，而坏的仓位却一直开着。

真正的停止条件必须由外部机制检查：

最近 30 笔交易的 Sharpe > 1.5
最大回撤 < 5%
测试套件全部通过

永远不要用“Agent 说它做完了”作为停止条件。

传统提示 vs 循环工程量化系统的真实对比

维度	传统手动提示方式	循环工程自运行系统
执行主体	你是循环本身	你是架构师，系统自己运行
知识累积	每次从零开始	SKILL.md + STATE.md 持续复利
验证可靠性	依赖生成者自我判断	独立 Verifier + 不同模型
并行能力	几乎没有	Worktrees 支持多阶段并行
执行能力	只能建议	通过 Connectors 真实下单
自我改进	几乎没有	每次失败自动写入新规则
人类时间成本	持续高	初期设计，之后接近零