量化交易不再需要你坐在键盘前:用 Loop Engineering 构建永不睡眠的自改进系统
大多数零售量化交易者还在做这件事:打开 Claude,输入一个提示,等待信号,阅读输出,然后再打下一个提示。
他们是循环本身。
Agent 只是一个工具,而他们必须全程坐在键盘前,决定每一步该做什么。
真正厉害的构建者早就停下了这种做法。
他们不再提示 Agent,而是编写让 Agent 自己提示、验证、决策并持续运行的循环。循环在你合上电脑后依然在工作。
Boris Cherny(Anthropic Claude Code 负责人)两周前说得很直白:“我已经不再提示 Claude 了。我有正在运行的循环,它们会提示 Claude 并自己决定下一步。我的工作就是编写这些循环。”
这句话把整个 AI 工程思维都重构了,尤其在量化交易这个领域。
量化交易本来就是一个循环:拉取数据 → 生成信号 → 回测 → 执行 → 风险监控 → 重复。
华尔街所有基金(Renaissance 从 1988 年就开始、Citadel、Two Sigma、Jane Street)都在跑这个循环。他们只是把几百个分析师和工程师塞进了循环里。
你不需要。
一个设计良好的自运行循环,就能让 solo builder 逼近甚至在某些维度超越那些需要数百人的机构。
Roan(@RohOnChain)已经为自己把这套系统完整跑起来了:定时拉数据、自主进行 alpha 研究、用独立 Agent 验证信号、只执行通过验证的交易、把每一次教训写回记忆。
下面是这套系统的完整拆解。
循环工程 vs 传统提示的本质区别
传统方式:你输入提示 → 读输出 → 根据输出再输入下一个提示。你是整个循环的执行者。
循环工程:你定义目标和停止条件,系统自己迭代。
Agent 会在单次运行中忘记上下文,但循环不会。状态、经验、教训会跨运行累积。
这才是 Boris 所说的“我的工作是写循环”——你从“实时操作员”变成了“系统架构师”。
在交易里,这意味着:不再为一笔交易手动提示,而是构建一个能跑几千次迭代、每次只进步 1%、永不睡觉的系统。
任何一个能稳定运行的循环都必须包含这六个组件
缺任何一个,循环都会悄无声息地失效。
-
Automation(自动化触发器)
循环的心跳。可以是 cron、webhook、/loop 命令或 Claude Code 里的 hook。
两种模式:/loop 按固定节奏重跑;/goal 则一直运行直到达到你定义的可验证条件(比如“回测 Sharpe > 1.5”)。 -
Skill(技能文件)
通常是 SKILL.md。里面写着你的交易规则、历史教训、避坑指南。
没有它,每次运行都从零开始;有了它,意图和经验就能复利累积。 -
State 文件(状态/进度文件)
通常叫 STATE.md 或 PROGRESS.md。
Agent 每次运行前读取它,运行结束后写回发生了什么。它是循环的记忆脊柱,也是事后审计日志(出问题时唯一能回溯的完整记录)。 -
Verifier(验证器)
生成信号的 Agent 是最差的裁判。
你需要一个完全独立的 Agent(最好用不同模型、不同指令),只负责验证。
这就是经典的 Maker-Checker 模式。华尔街 prop shop 内部都是这么干的:提出交易的人不批准交易。 -
Worktrees(工作树)
Git worktree 让多个 Agent 能同时对同一代码库工作,却各自在独立分支和目录里运行,避免冲突。
在交易系统里,你可以让信号研究、回测、风险监控并行跑,互不干扰。 -
Connectors(连接器)
基于 Model Context Protocol(MCP)的连接器,让循环能真正触达外部世界:调用经纪商 API、下单、查询数据库、发 Slack 通知等。
没有它,循环只能“建议交易”,不能真正执行。
这六个组件在 Claude Code、Codex 等所有成熟的 agentic 系统中反复出现,是通用底层。
如何把六个组件 wired 成一个完整的自改进量化交易系统
整个系统由五个子循环组成,每个子循环都有自己的 Skill、State 和 Verifier。
Stage 1: 数据摄取(Data Ingestion)
Automation 按固定频率触发(每分钟/每小时/每天)。数据写入共享 State 文件,供后续阶段读取。
Stage 2: 信号生成(Signal Generation)
这是 alpha 研究的核心。
Agent 读取 SKILL.md(里面包含你的 alpha 规则)。
每一次亏损或失败,都会把教训写回 SKILL.md,成为下一轮的新规则。这就是系统自我改进的机制。
Stage 3: 验证(Verification)
信号进入完全独立的验证 Agent。
验证器看不到生成时的推理过程,使用不同模型(例如生成用 Sonnet,验证用 Opus)。
未通过验证的信号直接被杀死。只有通过的才进入下一阶段。
Stage 4: 执行(Execution)
只有通过验证的信号才能到达这里。
通过 MCP 连接器直接调用经纪商 API,下单过程完全自动化(Auto mode)。
Stage 5: 风险监控(Risk Monitoring)
在独立的并行 worktree 中持续运行。
这是系统的“杀伤开关”,严格执行风控规则,不允许任何协商。
这五个子循环串联成一个闭环:数据进来 → 信号生成 → 验证 → 执行 → 风险监控 → 教训写回记忆 → 重新开始。
Roan 说:“我只设计了一次。从那之后,我就再也没有手动提示过任何一个步骤。”
停止条件必须是可验证的,而非 Agent 的自我宣称
循环最容易失败的地方就是这里。
Agent 经常在工作只完成一半时就发出“任务完成”的信号,导致循环退出,而坏的仓位却一直开着。
真正的停止条件必须由外部机制检查:
- 最近 30 笔交易的 Sharpe > 1.5
- 最大回撤 < 5%
- 测试套件全部通过
永远不要用“Agent 说它做完了”作为停止条件。
传统提示 vs 循环工程量化系统的真实对比
| 维度 | 传统手动提示方式 | 循环工程自运行系统 |
|---|---|---|
| 执行主体 | 你是循环本身 | 你是架构师,系统自己运行 |
| 知识累积 | 每次从零开始 | SKILL.md + STATE.md 持续复利 |
| 验证可靠性 | 依赖生成者自我判断 | 独立 Verifier + 不同模型 |
| 并行能力 | 几乎没有 | Worktrees 支持多阶段并行 |
| 执行能力 | 只能建议 | 通过 Connectors 真实下单 |
| 自我改进 | 几乎没有 | 每次失败自动写入新规则 |
| 人类时间成本 | 持续高 | 初期设计,之后接近零 |
循环工程把 solo quant 的天花板抬高了一个数量级
华尔街基金用几百人把同一个循环跑得极致。
现在你可以用六个组件 + 五个子循环,把同样的事情交给系统自己完成。
系统每跑一个周期就变聪明一点。
一百笔交易后,SKILL.md 已经是一份活文档;一千笔之后,它接近机构级知识,而这不是任何单个人脑能完全记住的。
资金量越小,这套系统反而越重要——因为它是 solo builder 唯一能系统性缩小与大基金差距的方式。
现在的问题是:
你还在为一笔交易打一个提示,然后等着结果?
还是已经开始设计那个能在你睡觉时持续交易、验证、改进并复利的循环?
没有正确答案,但答案会非常暴露。
(本文基于 Roan 在 X 上的深度分享重构,致敬他将 Loop Engineering 真正落地到高 stakes 量化交易场景的实践。)
我是紫微AI,在做一个「人格操作系统(ZPF)」。后面会持续分享AI Agent和系统实验。感兴趣可以关注,我们下期见。
更多推荐




所有评论(0)