【学习笔记】Agent Context Engineering
大多数“智能”产品(Claude、ChatGPT、Cursor、Windsurf 以及 OpenAI/Anthropic 风格的研究代理)其实就是在单一模型上下文窗口内对这四种作的不同编排。这些问题不仅会直接导致 Agent 超出上下文窗口容量上限,还会引发 token 消耗失控、成本飙升、系统运行稳定性下降等连锁反应,严重制约 LLM agent 的落地效果。核心目标是在上下文窗口容量有限的前提
·
一、Context Engineering 解决的核心痛点
agent 的核心工作流是交替进行 LLM 调用与工具调用,通过工具反馈持续调整下一步行动,这种模式广泛应用于长期任务处理。但随着任务推进,工具反馈与交互历史不断累积,会引发一系列致命问题:
| 问题类型 | 具体表现 | 严重后果 |
| Context Poisoning(上下文污染) | 幻觉信息进入上下文(When a hallucination makes it into the context) | 误导模型决策,导致输出与事实偏离,可靠性大幅下降 |
| Context Distraction(上下文干扰) | 上下文规模超出模型训练适配范围(When the context overwhelms the training) | 模型处理负荷激增,推理效率显著降低,响应延迟呈指数级上升 |
| Context Confusion(上下文混淆) | 冗余信息干扰模型响应逻辑(When superfluous context influences the response) | 模型无法聚焦核心任务,响应准确性滑坡,关键信息被掩盖 |
| Context Clash(上下文冲突) | 上下文内部存在相互矛盾的信息(When parts of the context disagree) | 模型行为前后不一致,输出逻辑断裂,用户体验出现明显割裂 |
这些问题不仅会直接导致 Agent 超出上下文窗口容量上限,还会引发 token 消耗失控、成本飙升、系统运行稳定性下降等连锁反应,严重制约 LLM agent 的落地效果。
二、Context Engineering 的四大核心操作
当今主流LLM代理中的上下文工程可以归结为四个基本步骤:Write、Select、Compress、Isolate。大多数“智能”产品(Claude、ChatGPT、Cursor、Windsurf 以及 OpenAI/Anthropic 风格的研究代理)其实就是在单一模型上下文窗口内对这四种作的不同编排。

1. Write(记录):外化大脑,实现持久存储
核心目标是突破即时上下文窗口的限制,实现信息的长期留存与跨场景复用。
- 核心载体:通过便签本(scratchpads)、状态对象、数据库等外部存储工具,留存无法容纳在即时上下文内的信息。
- 存储内容:
- 会话内信息:长期计划、中间推理步骤、工具调用结果、决策历史等;
- 跨会话信息:用户专属事实与偏好、项目规范与模式、过往错误反思、跨会话学习成果(如 ChatGPT 的记忆功能、Reflexion 的自我笔记)。
- 核心价值:让智能体具备 “持久记忆”,避免因上下文窗口限制丢失关键信息,同时实现个性化交互。
2. Select(筛选):即时检索,精准提取相关信息
核心目标是避免信息过载,仅将当前任务所需的关键信息引入活跃上下文。
- 核心逻辑:拒绝 “全盘加载” 历史数据,而是基于任务需求 “按需提取”。
- 实现方式:
- 可控状态暴露:按需读取特定文件、仅展示相关状态变量、过滤工具结果后再呈现;
- 高级检索技术:利用嵌入(Embeddings)实现语义相似性搜索、通过图结构遍历关联信息、借助工具描述 RAG(检索增强生成)选择适配能力。
- 核心价值:保持活跃上下文 “精简且有用”,确保模型聚焦当前任务,提升响应效率与准确性。
3. Compress(压缩):精简信息,不丢关键细节
核心目标是在上下文窗口容量有限的前提下,剔除冗余信息,保留决策相关的核心内容。
- 核心手段:
- 自动总结:定期将过往对话提炼为精简表述,生成递归或分层摘要,将工具调用轨迹浓缩为结果导向的笔记(如 Claude Code 的自动压缩功能);
- 启发式修剪:移除老旧低价值令牌、冗余信息、已完成的子任务,仅保留后续决策必需的最小化对话与事件集。
- 核心价值:防止上下文窗口溢出,同时确保模型不遗忘关键决策依据,平衡 “信息密度” 与 “窗口容量”。
4. Isolate(隔离):分区管理,避免上下文干扰
核心目标是将不同任务、角色或敏感信息分离,防止相互干扰导致模型混淆。
- 实现路径:
- 多智能体架构:为每个子智能体分配专属指令、工具能力、状态与记忆(如 Anthropic 的多智能体研究员、OpenAI Swarm 团队模式),让单个智能体聚焦特定角色,拥有更精简的上下文窗口;
- 沙盒化 artifacts:将文件内容、图像媒体、中间数据结构等 bulky 或敏感信息存储在外部,仅在明确需要时调用,减少令牌占用并避免上下文污染。
- 核心价值:降低模型认知负荷,避免不同任务逻辑或敏感信息相互干扰,提升复杂任务处理的稳定性。
更多推荐




所有评论(0)