为什么需要这个项目

市面上的 Agent 教程要么停留在"5 分钟搭建"的 Demo 层面,要么是纯学术论文综述。真正面向工程落地求职面试的系统性内容几乎没有。

zero2Agent 的核心理念是:

Agent 的复杂度应该随需求递增,而不是一上来就堆满框架。

从 30 行代码的 Agent Loop 开始,逐步加入 Tool Calling、Memory、Planning、多 Agent 协作——每一步都有代码,每一步都能跑。


内容全景:9 大模块、70+ 篇文章

zero2Agent

Agent Basic
8 篇

OpenClaw Agent
9 篇

Claude Code
12 篇

LangGraph
7 篇

SDK 框架
4 篇

框架调研
13 篇

Agent Training
6 篇

Agent Interview
12 篇

Final Project
🔲 进行中

下面逐个拆解每个模块的核心价值。


模块一:Agent Basic — 建立正确认知

8 篇文章,覆盖 Agent 工程的底层认知:

  • Agent vs Workflow:不是所有"自动化"都是 Agent,搞清楚本质区别
  • Tool Calling 完整机制:不是"给模型一个函数列表"那么简单
  • Memory 设计模式:短期记忆、长期记忆、外部存储,怎么选?
  • Planning & Reflection:什么时候该让 Agent 自己规划,什么时候不该
  • 为什么 Demo 能跑、落地就崩:这是面试最爱问的问题之一

如果你只有时间读一个模块,读这个。它决定了你后面所有学习的认知上限。


模块二:OpenClaw Agent — 60 行代码推导框架

从 60 行核心代码出发,一步步推导出完整的 Agent 框架:

workflow = node + node        # 有向路径,无循环
chatbot  = workflow + loop    # 外层循环,多轮对话
agent    = chatbot + tools    # 图内回路,模型驱动工具

9 篇文章覆盖:

  • 为什么自己实现比直接用框架更重要
  • RAG 作为 VectorDB 的工程实践
  • Tool / MCP / Skill 三种工具形态对比
  • Context 与 Memory 的压缩策略
  • 多 Agent 并行团队架构
  • pi-mono 生产级架构解析

核心观点:主流框架(LangChain、Dify)过度封装,真正的生产 Agent(Claude Code、Cursor、pi-mono)都是轻量自研。 理解了底层原理,用什么框架都是一层皮。

OpenClaw Agent 渐进式构建路径图


模块三:Claude Code — 12 节课手写 Coding Agent

这是整个项目最硬核的模块。12 节课,从 30 行 Agent Loop 逐步构建出完整的 Coding Agent 系统:

阶段 课程 机制
基础篇 S01-S06 Agent Loop → Tool Dispatch → TodoWrite → Subagent → Skill Loading → Context Compact
进阶篇 S07-S12 Task DAG → Background Tasks → Agent Teams → Protocols → Autonomous Agent → Worktree Isolation

每节课都是在前一节的基础上增量构建——不是看完就忘的理论,而是实实在在能运行的代码。

学完这 12 节课,你能清楚回答:

  • Claude Code 的 Agent Loop 怎么跑的?
  • Subagent 的 Context 隔离怎么做?
  • 多 Agent Team 之间怎么通信和协调?
  • Worktree 隔离的工程意义是什么?

模块四:LangGraph — 图结构编排 Agent

7 篇文章,用图结构描述 Agent 执行逻辑:

  • State + Node + Graph 三件套:TypedDict 状态设计,节点函数,编译运行
  • 条件分支add_conditional_edges,根据状态动态路由
  • 并行执行:Fan-out / Fan-in,多节点并发处理
  • Prompt Chaining:分步生成,节点间传递中间结果
  • LLM 集成:OpenAI / HuggingFace 在节点中的完整写法

LangGraph 的核心价值是把"意大利面条式"的 Agent 代码变成可维护的状态机


模块五:SDK 框架 — 三大原厂 SDK 横向对比

4 篇文章,深入拆解三大原厂 SDK:

SDK 核心特色
OpenAI Agents SDK @function_tool 装饰器,Runner 自动循环,handoffs 多 Agent
Google genai SDK 两种后端(AI Studio / Vertex AI),Function Calling,多模态
Claude Anthropic SDK Messages API,Tool Use 手动循环,Extended Thinking

第四篇是横向对比:API 设计哲学差异、Tool Calling 实现方式、定价参考、选型建议。

核心结论:轻量原厂 SDK 比第三方框架更稳定、更完整、更适合生产。


模块六:框架调研 — 13 大框架横向测评

覆盖当前市面上最主流的 Agent 框架:

框架 来源 一句话特色
AgentScope 阿里巴巴 分布式多 Agent
Mastra 开源 TypeScript 原生
Semantic Kernel 微软 企业级 Plugin 体系
Eino 字节跳动 Go 语言,高并发
DeerFlow 字节跳动 Deep Research
LangChain 开源 最大生态,以及何时不该用它
Google ADK Google 官方 Agent 套件
Vercel AI SDK Vercel Next.js 全栈 AI
AutoGen 微软 多 Agent 对话
... 还有 4 个

看完这 13 篇,面试官问你"为什么选这个框架不选那个",你能给出有理有据的回答。


模块七:Agent Training — 训练 Agent 的工程实践

6 篇文章,覆盖 Agent 训练的关键技术:

  • Agent SFT:轨迹数据 vs 单轮 QA,为什么训 Agent 不能用普通 SFT 数据
  • Agent RL:轨迹构造与 Loss Mask 策略
  • GRPO vs PPO:两种强化学习方法的对比与选型
  • 数据混合策略:训练数据的配比与质量把控
  • Agent 评估指标:怎么衡量 Agent 好不好
  • 从 SFT 到部署:完整的 Pipeline

这个模块在面试中的杀伤力极大——能把 Agent 训练讲清楚的候选人,凤毛麟角。


模块八:Agent Interview — 大厂面试真题库

这是求职人群最关心的模块。 12 篇文章,覆盖 2025-2026 年大厂 Agent 方向的真实面试题:

覆盖公司:蚂蚁集团、阿里巴巴、字节跳动、腾讯、携程

11 大核心维度

  1. 架构设计
  2. 工具管理(Tool / MCP / API)
  3. 容错与恢复
  4. Memory 与 Context
  5. 评估与可视化
  6. 多 Agent 协作
  7. 工程踩坑
  8. Prompt Engineering
  9. RAG 检索
  10. 训练与数据
  11. AI 代码测试

每道题都有"新手答"vs"高手答"的对比——让你直观看到面试官想听什么,以及大多数人差在哪里。

举个例子:面试官问"多 Agent 协作怎么做容错?"

  • 新手答:加 try-catch,失败了重试
  • 高手答:从超时熔断、状态回滚、降级策略、人工介入四个层面展开,结合具体架构说明

大厂 Agent 面试新手答与高手答对比图

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐