【人工智能】彻底搞懂AI技术:AI、AGI、LLM、Agent

一. 什么是AI

AI就是操作系统级别的存在。它的全称:Artificial Intelligence(人工智能)。
它是所有相关技术的总称是一个领域,不是一个具体产品。
就像计算机科学一样,它涵盖了所有让机器模拟人类智能的研究。
AI定义了智能这个概念的范围。可以跑各种应用:推荐系统、语音助手、自动驾驶、下棋程序……这些都是AI的APP

二. AI包含什么

它包含了机器学习(ML),深度学习(DL),自然语言处理(NLP),计算机视觉(CV),专家系统、机器人学、知识图谱。

三. 什么是LLM

LLM的全称是Large Language Model大语言模型。是一种基于海量文本训练的深度学习模型,核心能力是理解和生成自然语言。
就像Web开发里的React、Spring Boot一样,LLM是AI领域当前最主流的技术路径,但不是AI的全部。
LLM是AI的语言处理引擎。它非常擅长说话、理解语言、推理逻辑,但它只会说话。
常见的 LLM 产品:
• Claude (Anthropic 公司)
• ChatGPT (OpenAI 公司)
• 文心一言(百度)
• Kimi(月之暗面)
• 通义千问(阿里)

四. LLM与Agent的关系

我们可以把LLM比作一个超级聪明的顾问,你问什么它都能答,但它只能回答不能动手帮你去干。而Agent相当于给这个聪明顾问找了手脚+工具箱,不仅仅是想想然后回答,还能够真正给我们做事情。

五. Agent的四大组件以及Agent工具

Agent是一个能够自主感知环境、做出决策、执行行动的AI系统。
1.LLM作为“大脑”:负责理解、规划、推理
2.工具(Tools):搜索引擎、代码解释器、API、数据库
3.记忆(Memory):短期上下文 + 长期向量库
4.执行器(Executor):真正去调用工具、执行代码
常用的Agent工具:Claude Code、OpenClaw、Cursor等等。

六. Agent 能做什么?

传统的 LLM(如 ChatGPT)只会「说话」,但Agent可以真正做事:操作电脑、浏览网页、发送邮件、管理文件。
它代表了AI的进化方向。
• 自动帮你查邮件并整理摘要
• 帮你监控商品价格,降价了自动通知
• 自动填写网页表单
• 帮你写代码、运行代码、调试问题
• 每天定时给你发天气预报

七. Prompt什么是提示词

提示词可以简单理解为【你对AI说的话】。
提示词工程(Prompt Engineering)就是研究怎么写提示词才能让AI输出更好的结果。
这是一门新兴的技能,有人靠写好提示词就能让AI产出专业级内容。
如果LLM是一个超级学霸,提示词就是你的提问方式。问得好,答得妙;问得糊,答得懵。

八. Skill什么是技能

Skill(技能)是Agent掌握的具体本领。也可以将其理解为具象化的工具。技能越多Agent能做的事情就越多。
比如:
• 搜索技能:让 Agent 能搜索网络信息
• 邮件技能:让 Agent 能读邮件、发邮件
• 代码技能:让 Agent 能写代码、运行代码
• 日历技能:让 Agent 能管理你的日程
• 文件技能:让 Agent 能读写文件
Agent的强大之处在于可扩展。开发者可以不断开发新的Skill,让Agent学会新本领。就像给手机装App一样,想干什么就装什么技能。

九. 什么是AGI

Artificial General Intelligence通用人工智能的意思。它是指具备人类水平的通用智能——能像人一样,跨领域学习、推理、迁移知识,遇到没见过的任务也能举一反三。
AGI目前还是科研界的一个目标,没有公认的实现。目前所有AI系统(包括GPT-5、Claude 4、Gemini Ultra)都属于狭义AI(ANI)

十. 总结

LLM是脑,Prompt是话,Agent是人,Skill是手艺。

概念 类比角色 解释
AI “商业”这个领域 整个行业的知识体系、方法论、历史
AGI 一个全能CEO 能管销售、能写代码、能做HR、能搞研发——什么都会,还没出现
LLM 一个超级文案 特别能写、能说、能沟通,但只能动嘴
Agent 给文案配了全套团队 文案+数据分析师+开发+执行——能想能说还能干
Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐