一、什么是 LlamaIndex(初识)

1. 官方定义

LlamaIndex 是开源上下文增强 LLM 应用框架,专注解决大模型无法访问私有数据、上下文有限、缺乏领域知识的问题,是构建 RAG、智能代理、工作流的首选工具之一。

2. 核心定位

  • 大模型的数据连接器:对接文档、数据库、API、云存储等多源数据
  • 大模型的记忆增强系统:通过索引 + 检索,给模型补充私有知识
  • 大模型的任务编排引擎:支持代理自主决策、工作流自动化执行

3. 核心能力

  1. 数据接入:Readers 读取 PDF/Excel/ 网页 / 数据库等
  2. 数据处理:分块、向量化、元数据管理
  3. 索引构建:向量索引、关键词索引、知识图谱索引等
  4. 查询交互:Query Engine(问答)、Chat Engine(对话)
  5. 高级能力:Agent(自主代理)、Workflow(工作流编排)

二、LlamaIndex 快速入门(5 行代码跑通 RAG)

1. 环境准备

# 安装核心包
pip install llama-index
# 配置 OpenAI Key(也可换本地模型)
export OPENAI_API_KEY="你的API密钥"

2. 极简 RAG 示例

# 1. 导入核心模块
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader

# 2. 加载 data 文件夹下的文档(txt/md/pdf 等)
documents = SimpleDirectoryReader("data").load_data()

# 3. 构建向量索引
index = VectorStoreIndex.from_documents(documents)

# 4. 创建查询引擎
query_engine = index.as_query_engine()

# 5. 提问并输出答案
response = query_engine.query("这份文档的核心内容是什么?")
print(response)

3. 执行步骤

  1. 新建 data 文件夹,放入任意文本文件
  2. 运行代码,即可实现私有文档智能问答

三、核心概念:什么是 Agent(代理)?

1. 通俗理解

代理 = LLM + 工具 + 记忆 + 自主决策不是简单问答,而是能自己拆任务、选工具、多步推理、完成复杂目标的智能体。

2. 核心特点

  • 自主规划:把复杂问题拆成多步(如 “先查数据→再计算→最后总结”)
  • 工具调用:调用查询引擎、API、数据库、代码执行器等
  • 记忆能力:保留对话历史,支持多轮交互
  • 反思修正:根据结果调整策略,提升准确性

3. LlamaIndex 主流代理类型

  • ReAct Agent:推理 + 行动,最通用
  • Function Calling Agent:基于函数调用,精准执行工具
  • CodeAct Agent:自动生成并执行代码,适合数据分析

4. 适用场景

  • 多步骤数据分析
  • 跨文档信息整合
  • 自动化业务流程(如报表生成、信息核验)

四、核心概念:什么是 Workflow(工作流)?

1. 通俗理解

工作流 = 事件驱动的多步骤 AI 任务编排把 RAG、代理、工具调用、数据处理等步骤,串成可复用、可监控、可暂停恢复的自动化流程。

2. 核心特性

  • 事件驱动:Step 接收事件→处理→输出新事件→驱动下一步
  • 状态管理:Context 全局状态,数据在步骤间流转
  • 异步优先:高性能,适配生产环境(如 FastAPI)
  • 灵活编排:支持分支、循环、并行、重试、异常处理

3. 核心组成

  • Step:工作流最小执行单元(一个函数 / 一个工具调用)
  • Event:步骤间传递的消息 / 数据
  • Context:全局状态,共享数据
  • StopEvent:结束工作流的信号

4. 适用场景

  • 复杂 RAG pipeline(检索→重排→校验→生成)
  • 多代理协作任务
  • 生产级 AI 自动化服务

五、学习总结

1. 核心关系

  • LlamaIndex:底座,提供数据、索引、检索、代理、工作流全能力
  • RAG:基础能力,解决大模型私有知识问答
  • Agent:高级能力,自主决策 + 工具调用
  • Workflow:编排能力,把 RAG/Agent 组装成生产级流程

2. 学习路径

  1. 入门:跑通 5 行 RAG 代码,理解数据加载→索引→查询
  2. 进阶:学习 Query/Chat Engine 优化(分块、检索、重排)
  3. 高阶:掌握 Agent 自主任务、Workflow 流程编排

3. 关键记忆点

  • LlamaIndex = 数据 + 检索 + 代理 + 工作流
  • Agent = 会思考、会用工具的智能体
  • Workflow = 事件驱动的多步骤 AI 自动化
Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐