一、Context Engineering 解决的核心痛点

        agent 的核心工作流是交替进行 LLM 调用与工具调用,通过工具反馈持续调整下一步行动,这种模式广泛应用于长期任务处理。但随着任务推进,工具反馈与交互历史不断累积,会引发一系列致命问题:

问题类型 具体表现 严重后果
Context Poisoning(上下文污染) 幻觉信息进入上下文(When a hallucination makes it into the context) 误导模型决策,导致输出与事实偏离,可靠性大幅下降
Context Distraction(上下文干扰) 上下文规模超出模型训练适配范围(When the context overwhelms the training) 模型处理负荷激增,推理效率显著降低,响应延迟呈指数级上升
Context Confusion(上下文混淆) 冗余信息干扰模型响应逻辑(When superfluous context influences the response) 模型无法聚焦核心任务,响应准确性滑坡,关键信息被掩盖
Context Clash(上下文冲突) 上下文内部存在相互矛盾的信息(When parts of the context disagree) 模型行为前后不一致,输出逻辑断裂,用户体验出现明显割裂

这些问题不仅会直接导致 Agent 超出上下文窗口容量上限,还会引发 token 消耗失控、成本飙升、系统运行稳定性下降等连锁反应,严重制约 LLM agent 的落地效果。

二、Context Engineering 的四大核心操作

        当今主流LLM代理中的上下文工程可以归结为四个基本步骤:Write、Select、Compress、Isolate。大多数“智能”产品(Claude、ChatGPT、Cursor、Windsurf 以及 OpenAI/Anthropic 风格的研究代理)其实就是在单一模型上下文窗口内对这四种作的不同编排。

1. Write(记录):外化大脑,实现持久存储

核心目标是突破即时上下文窗口的限制,实现信息的长期留存与跨场景复用。

  • 核心载体:通过便签本(scratchpads)、状态对象、数据库等外部存储工具,留存无法容纳在即时上下文内的信息。
  • 存储内容
    • 会话内信息:长期计划、中间推理步骤、工具调用结果、决策历史等;
    • 跨会话信息:用户专属事实与偏好、项目规范与模式、过往错误反思、跨会话学习成果(如 ChatGPT 的记忆功能、Reflexion 的自我笔记)。
  • 核心价值:让智能体具备 “持久记忆”,避免因上下文窗口限制丢失关键信息,同时实现个性化交互。

2. Select(筛选):即时检索,精准提取相关信息

核心目标是避免信息过载,仅将当前任务所需的关键信息引入活跃上下文。

  • 核心逻辑:拒绝 “全盘加载” 历史数据,而是基于任务需求 “按需提取”。
  • 实现方式
    • 可控状态暴露:按需读取特定文件、仅展示相关状态变量、过滤工具结果后再呈现;
    • 高级检索技术:利用嵌入(Embeddings)实现语义相似性搜索、通过图结构遍历关联信息、借助工具描述 RAG(检索增强生成)选择适配能力。
  • 核心价值:保持活跃上下文 “精简且有用”,确保模型聚焦当前任务,提升响应效率与准确性。

3. Compress(压缩):精简信息,不丢关键细节

核心目标是在上下文窗口容量有限的前提下,剔除冗余信息,保留决策相关的核心内容。

  • 核心手段
    • 自动总结:定期将过往对话提炼为精简表述,生成递归或分层摘要,将工具调用轨迹浓缩为结果导向的笔记(如 Claude Code 的自动压缩功能);
    • 启发式修剪:移除老旧低价值令牌、冗余信息、已完成的子任务,仅保留后续决策必需的最小化对话与事件集。
  • 核心价值:防止上下文窗口溢出,同时确保模型不遗忘关键决策依据,平衡 “信息密度” 与 “窗口容量”。

4. Isolate(隔离):分区管理,避免上下文干扰

核心目标是将不同任务、角色或敏感信息分离,防止相互干扰导致模型混淆。

  • 实现路径
    • 多智能体架构:为每个子智能体分配专属指令、工具能力、状态与记忆(如 Anthropic 的多智能体研究员、OpenAI Swarm 团队模式),让单个智能体聚焦特定角色,拥有更精简的上下文窗口;
    • 沙盒化 artifacts:将文件内容、图像媒体、中间数据结构等 bulky 或敏感信息存储在外部,仅在明确需要时调用,减少令牌占用并避免上下文污染。
  • 核心价值:降低模型认知负荷,避免不同任务逻辑或敏感信息相互干扰,提升复杂任务处理的稳定性。
Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐