在这里插入图片描述

什么是 Agent?

你可能已经听过"AI Agent(智能体)"这个词了。

但它到底和 ChatGPT 有什么不一样?它是怎么"自主"完成任务的?循环又是什么意思?

这篇文章是我在学习 AI Agent 过程中的整理输出。用最简单的方式,把这几个问题讲清楚。

一、什么是 Agent?

一句话定义:

AI Agent = 大模型 + 工具调用能力 + 循环(loop)

这三个要素缺一不可:

  • 大模型:负责"思考",判断下一步该做什么
  • 工具调用能力:让大模型能真正"动手",比如搜索、写代码、查数据库
  • 循环:执行完一步,把结果塞回去,继续思考下一步

“循环"是 Agent 区别于普通 LLM 最关键的特征。没有循环,工具调用也只是"调用一次就结束”。正是循环让 Agent 能处理需要多步骤的任务。

ReAct 模式:Agent 的运行机制

Agent 内部的循环,具体长这样:

用户输入问题
      ↓
   大模型思考
      ↓
 需要调用工具吗?
  ├── 否 → 直接输出结果
  └── 是 → 执行工具
           ↓
       把工具结果塞回上下文
           ↓
       继续思考(回到第二步)

这个"思考 → 判断 → 执行 → 再思考"的循环,就叫 ReAct 模式

二、它与 ChatGPT 的区别?

ChatGPT:你说一句,它回一句。对话结束。

AI Agent:你说一句,它自己决定下一步做什么,自己去执行,自己看结果,自己再决定下一步……最后才把结果告诉你。

举个例子,你说"帮我查一下今天上海的天气,然后告诉我要不要带伞":

  • ChatGPT 会说:“我没有实时数据,无法查询”
  • AI Agent 会:调用天气工具 → 拿到数据 → 思考要不要带伞 → 告诉你结论

关键差异在于:Agent 会主动"做事",而不只是"回答"。

三、为什么循环次数是不确定的?

因为每次循环后,模型"看到的东西"都不一样:

第 1 次思考:只有"用户的问题"
         ↓ 调用工具
第 2 次思考:用户的问题 + 工具返回的结果
         ↓ 调用工具
第 3 次思考:用户的问题 + 结果1 + 结果2
         ↓ 没有工具需要调用了
     输出最终结果

任务复杂,需要调用的工具多,循环就多;任务简单,一次就够,甚至不需要循环。

所以循环次数不是预先设定的,而是由任务本身决定的:有工具要调用,就继续循环;没有了,就停。

注意第 2、3 次思考时,上下文里带着之前所有的工具结果。这意味着模型每一轮的"判断依据"都在增加——这也是为什么 Agent 能处理多步推理任务,而不是每次都从零开始。

结尾

总结一下:

  • Agent = 大模型 + 工具 + 循环,三者缺一不可
  • 它和 ChatGPT 最大的区别是:能主动执行,而不只是回答
  • 循环次数不固定,由任务复杂度决定

下一篇,我会聊工具(Tool)到底是什么,以及 Agent 是如何"知道"该用哪个工具的。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐