1-LangChain 简介
·
LangChain 完整简介
一、LangChain 是什么
LangChain 是一套用于构建大语言模型(LLM)应用的 Python 模块化开发框架。

核心定位
提供统一标准化接口对接各类大模型,可快速搭建具备工具调用、知识库检索、对话上下文记忆能力的智能 Agent。
解决的核心问题
原生大模型仅能基于训练数据生成文本,无法和外部世界交互; 而实际业务需要 AI 完成:查询数据库、调用第三方 API、读取本地文档、联网搜索、发送消息等操作。 LangChain 封装全套标准化组件,快速串联各类外部能力,补齐 LLM 应用工程化能力。

二、LangChain 核心组件一览
表格
| 组件 | 作用 | 核心功能 | 常见用途 |
|---|---|---|---|
| Models(模型层) | 统一连接各类大语言模型 | 1. 标准化模型调用接口2. 一行代码切换不同模型3. 兼容 GPT/Claude/Gemini/DeepSeek/Ollama 等 | 通用聊天机器人、文本生成、基础 AI 问答 |
| Prompts(提示词模板) | 统一管理、复用提示词 | 1. 提示词参数化填充2. 动态变量替换3. 模板封装复用 | 多轮对话、批量内容生成、约束模型结构化输出 |
| Document Loader(文档加载器) | 读取各类外部文档数据源 | 1. 加载 PDF/TXT/DOCX/Markdown2. 抓取网页、读取数据库内容3. 统一文档数据格式 | 私有知识库搭建、RAG 检索系统、文档问答 |
| Text Splitter(文本切分器) | 对超长文本分段处理 | 1. 文本分片(Chunk)切割2. 精准控制 Token 长度3. 优化向量检索匹配效果 | RAG 知识库、向量数据库存储、超长文档解析 |
| Memory(记忆模块) | 给对话增加上下文记忆能力 | 1. 自动保存聊天历史2. 支持短期 / 长期记忆持久化3. 维护完整对话状态 | 多轮聊天助手、智能客服、工具型 Agent |
| Retriever(检索器) | 从知识库召回相关内容 | 1. 向量相似度搜索2. 语义匹配检索3. 过滤无关文档片段 | 企业私有知识库、本地文档问答、AI 本地搜索 |
| Tools(工具集) | 赋予模型调用外部能力 | 1. 联网搜索工具2. 数据库查询工具3. 代码执行、邮件发送等自定义 API | 自主 Agent、自动化办公、智能数据分析 |
| Output Parser(输出解析器) | 规范、解析大模型返回内容 | 1. 强制结构化输出2. JSON / 表格格式化解析3. 输出格式校验 | 程序对接 API、表单信息提取、自动化数据处理 |
| Chains(执行链) | 串联多个组件形成完整工作流 | 1. 多步骤任务串行执行2. 自定义业务流程编排3. 组件灵活组合复用 | 完整 RAG 问答流程、复杂 AI 任务、自动化 Agent 系统 |
三、LangChain 三层技术架构
从底层到上层分为三层,分层解耦便于扩展、替换组件:
表格
| 分层 | 说明 | 对应 Python 包 |
|---|---|---|
| 核心抽象层 | 定义模型、消息、工具、文档等通用底层接口,无厂商绑定 | langchain-core |
| 用户接口层 | 提供开箱即用高阶 API,快速封装对话、Agent、检索能力 | langchain |
| 第三方集成层 | 对接各大模型厂商、向量库、工具的专属集成包 | langchain-openai、langchain-anthropic、langchain-ollama 等 |
四、为什么选择 LangChain
仅单次调用模型 API 直接发 HTTP 请求即可,但搭建完整工业级 AI 应用,LangChain 具备不可替代优势:
表格
| 核心能力 | 功能描述 | 适用业务场景 |
|---|---|---|
| 统一模型调用接口 | 一套业务代码无缝切换 OpenAI/DeepSeek/Claude/ 本地 Ollama 等模型,快速做多模型对比、控制调用成本 | 多厂商模型兼容项目、线上成本优化、本地私有化部署 |
| 原生 Agent 智能架构 | 内置思考 - 行动循环,模型自主判断何时调用工具、选择工具、规划执行步骤 | 自动化办公助手、复杂智能客服、多步骤任务处理 |
| 可扩展中间件系统 | 支持在模型请求前后自定义拦截逻辑:失败重试、缓存问答、敏感词过滤、日志埋点 | 生产环境稳定 AI 服务、高并发线上系统 |
| 标准化结构化输出 | 强制模型返回 JSON / 列表等固定格式,无需手动正则解析文本 | 合同信息提取、表单自动填充、后端程序数据对接 |
| 完善记忆持久化方案 | 内置会话记忆,支持持久化存储用户历史对话、用户偏好 | 长会话 AI 助手、个性化智能客服 |
| 海量生态集成 | 数百种第三方工具、向量数据库、文档格式集成,开箱即用 | 快速落地知识库、自动化工具、私有化 AI 项目 |
五、LangChain 典型应用场景
1. 多轮智能聊天机器人
自带对话记忆,支持自动调用外部工具:查询天气、订单查询、发送邮件、数据查询等综合对话助手。
2. RAG 私有知识库问答
上传 PDF / 网页 / 内部文档,向量化存入向量库;用户提问时自动检索对应文档片段,让大模型基于私有资料作答并标注引用来源。
3. 自主规划 Agent 自动化助手
模型自主拆解复杂任务、分步调用对应工具完成全流程操作。 示例需求:整理上周销售数据、计算同比、自动生成可视化分析报告并发送邮件。
4. 非结构化数据提取与智能分析
从合同、票据、扫描文档中自动提取姓名、金额、日期等结构化字段;或基于海量文本自动生成数据分析总结。
六、LangChain 与 LangGraph 区别 & 关联
初学者极易混淆两个库,核心对比:
表格
| 对比维度 | LangChain | LangGraph |
|---|---|---|
| 产品定位 | 高层封装 Agent 框架,开箱即用 | 底层图工作流引擎,精细管控流程 |
| 上手难度 | 低,少量代码快速搭建基础 Agent | 中高,需要理解图、节点、状态流转概念 |
| 适用场景 | 标准 RAG、基础对话、快速原型验证 | 复杂分支流程、多 Agent 协同、带循环判断的任务 |
| 底层关系 | LangChain 新版create_agent() 底层基于 LangGraph 实现 |
LangChain 底层依赖的流程引擎 |
学习建议:新手优先从 LangChain 入门;当业务需要复杂分支、循环、多智能体协作时,再学习 LangGraph。
七、学习前置准备
需掌握以下基础:
- Python 基础语法(函数、类、类型注解)
- 会使用
pip安装第三方 Python 包 - 基础命令行操作能力
- 任意一款大模型 API Key(OpenAI、DeepSeek、Claude、本地 Ollama 均可)
- python版本推荐3.12
- 推荐初学者安装组合
$ pip install langchain langchain-openai python-dotenv
八、简单示例
运行之前 需要在你的项目目录下
创建一个“.env”文件,文件内容:
#openai兼容方式
HUNYUAN_API_KEY=sk-Sfzf12NTLpsddsdOoO1211Dv9NdYT3Dx38gBpeJ127IJHHyoyUTyH0121
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
# 加载环境变量
loaded = load_dotenv()
if not loaded:
print("警告:.env 文件未找到")
model_hy: ChatOpenAI = ChatOpenAI(
model="hunyuan-lite",
api_key=os.getenv("HUNYUAN_API_KEY"),
base_url="https://api.hunyuan.cloud.tencent.com/v1",
# 温度
temperature=1,
# 关闭流式输出(对应 stream: false)
streaming=False,
)
# 调用模型
response_hy = model_hy.invoke("rust语言后续发展如何")
print(response_hy.content)
九、常用网址
LangChain 官网: https://www.langchain.com/
LangChain Python 文档: https://python.langchain.com/
LangChain JavaScript 文档: https://js.langchain.com/
LangChain GitHub: https://github.com/langchain-ai/langchain
官网有时候访问不了,就是访问python和js的就是可以获取相应的文档支持了
更多推荐


所有评论(0)