从Java转行大模型应用,LlamaIndex入门
·
一、什么是 LlamaIndex(初识)
1. 官方定义
LlamaIndex 是开源上下文增强 LLM 应用框架,专注解决大模型无法访问私有数据、上下文有限、缺乏领域知识的问题,是构建 RAG、智能代理、工作流的首选工具之一。
2. 核心定位
- 大模型的数据连接器:对接文档、数据库、API、云存储等多源数据
- 大模型的记忆增强系统:通过索引 + 检索,给模型补充私有知识
- 大模型的任务编排引擎:支持代理自主决策、工作流自动化执行
3. 核心能力
- 数据接入:Readers 读取 PDF/Excel/ 网页 / 数据库等
- 数据处理:分块、向量化、元数据管理
- 索引构建:向量索引、关键词索引、知识图谱索引等
- 查询交互:Query Engine(问答)、Chat Engine(对话)
- 高级能力:Agent(自主代理)、Workflow(工作流编排)
二、LlamaIndex 快速入门(5 行代码跑通 RAG)
1. 环境准备
# 安装核心包
pip install llama-index
# 配置 OpenAI Key(也可换本地模型)
export OPENAI_API_KEY="你的API密钥"
2. 极简 RAG 示例
# 1. 导入核心模块
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
# 2. 加载 data 文件夹下的文档(txt/md/pdf 等)
documents = SimpleDirectoryReader("data").load_data()
# 3. 构建向量索引
index = VectorStoreIndex.from_documents(documents)
# 4. 创建查询引擎
query_engine = index.as_query_engine()
# 5. 提问并输出答案
response = query_engine.query("这份文档的核心内容是什么?")
print(response)
3. 执行步骤
- 新建
data文件夹,放入任意文本文件 - 运行代码,即可实现私有文档智能问答
三、核心概念:什么是 Agent(代理)?
1. 通俗理解
代理 = LLM + 工具 + 记忆 + 自主决策不是简单问答,而是能自己拆任务、选工具、多步推理、完成复杂目标的智能体。
2. 核心特点
- 自主规划:把复杂问题拆成多步(如 “先查数据→再计算→最后总结”)
- 工具调用:调用查询引擎、API、数据库、代码执行器等
- 记忆能力:保留对话历史,支持多轮交互
- 反思修正:根据结果调整策略,提升准确性
3. LlamaIndex 主流代理类型
- ReAct Agent:推理 + 行动,最通用
- Function Calling Agent:基于函数调用,精准执行工具
- CodeAct Agent:自动生成并执行代码,适合数据分析
4. 适用场景
- 多步骤数据分析
- 跨文档信息整合
- 自动化业务流程(如报表生成、信息核验)
四、核心概念:什么是 Workflow(工作流)?
1. 通俗理解
工作流 = 事件驱动的多步骤 AI 任务编排把 RAG、代理、工具调用、数据处理等步骤,串成可复用、可监控、可暂停恢复的自动化流程。
2. 核心特性
- 事件驱动:Step 接收事件→处理→输出新事件→驱动下一步
- 状态管理:Context 全局状态,数据在步骤间流转
- 异步优先:高性能,适配生产环境(如 FastAPI)
- 灵活编排:支持分支、循环、并行、重试、异常处理
3. 核心组成
- Step:工作流最小执行单元(一个函数 / 一个工具调用)
- Event:步骤间传递的消息 / 数据
- Context:全局状态,共享数据
- StopEvent:结束工作流的信号
4. 适用场景
- 复杂 RAG pipeline(检索→重排→校验→生成)
- 多代理协作任务
- 生产级 AI 自动化服务
五、学习总结
1. 核心关系
- LlamaIndex:底座,提供数据、索引、检索、代理、工作流全能力
- RAG:基础能力,解决大模型私有知识问答
- Agent:高级能力,自主决策 + 工具调用
- Workflow:编排能力,把 RAG/Agent 组装成生产级流程
2. 学习路径
- 入门:跑通 5 行 RAG 代码,理解数据加载→索引→查询
- 进阶:学习 Query/Chat Engine 优化(分块、检索、重排)
- 高阶:掌握 Agent 自主任务、Workflow 流程编排
3. 关键记忆点
- LlamaIndex = 数据 + 检索 + 代理 + 工作流
- Agent = 会思考、会用工具的智能体
- Workflow = 事件驱动的多步骤 AI 自动化
更多推荐

所有评论(0)