LangChain 完整简介

一、LangChain 是什么

LangChain 是一套用于构建大语言模型(LLM)应用的 Python 模块化开发框架。

核心定位

提供统一标准化接口对接各类大模型,可快速搭建具备工具调用、知识库检索、对话上下文记忆能力的智能 Agent。

解决的核心问题

原生大模型仅能基于训练数据生成文本,无法和外部世界交互; 而实际业务需要 AI 完成:查询数据库、调用第三方 API、读取本地文档、联网搜索、发送消息等操作。 LangChain 封装全套标准化组件,快速串联各类外部能力,补齐 LLM 应用工程化能力。

二、LangChain 核心组件一览

表格

组件 作用 核心功能 常见用途
Models(模型层) 统一连接各类大语言模型 1. 标准化模型调用接口2. 一行代码切换不同模型3. 兼容 GPT/Claude/Gemini/DeepSeek/Ollama 等 通用聊天机器人、文本生成、基础 AI 问答
Prompts(提示词模板) 统一管理、复用提示词 1. 提示词参数化填充2. 动态变量替换3. 模板封装复用 多轮对话、批量内容生成、约束模型结构化输出
Document Loader(文档加载器) 读取各类外部文档数据源 1. 加载 PDF/TXT/DOCX/Markdown2. 抓取网页、读取数据库内容3. 统一文档数据格式 私有知识库搭建、RAG 检索系统、文档问答
Text Splitter(文本切分器) 对超长文本分段处理 1. 文本分片(Chunk)切割2. 精准控制 Token 长度3. 优化向量检索匹配效果 RAG 知识库、向量数据库存储、超长文档解析
Memory(记忆模块) 给对话增加上下文记忆能力 1. 自动保存聊天历史2. 支持短期 / 长期记忆持久化3. 维护完整对话状态 多轮聊天助手、智能客服、工具型 Agent
Retriever(检索器) 从知识库召回相关内容 1. 向量相似度搜索2. 语义匹配检索3. 过滤无关文档片段 企业私有知识库、本地文档问答、AI 本地搜索
Tools(工具集) 赋予模型调用外部能力 1. 联网搜索工具2. 数据库查询工具3. 代码执行、邮件发送等自定义 API 自主 Agent、自动化办公、智能数据分析
Output Parser(输出解析器) 规范、解析大模型返回内容 1. 强制结构化输出2. JSON / 表格格式化解析3. 输出格式校验 程序对接 API、表单信息提取、自动化数据处理
Chains(执行链) 串联多个组件形成完整工作流 1. 多步骤任务串行执行2. 自定义业务流程编排3. 组件灵活组合复用 完整 RAG 问答流程、复杂 AI 任务、自动化 Agent 系统

三、LangChain 三层技术架构

从底层到上层分为三层,分层解耦便于扩展、替换组件:

表格

分层 说明 对应 Python 包
核心抽象层 定义模型、消息、工具、文档等通用底层接口,无厂商绑定 langchain-core
用户接口层 提供开箱即用高阶 API,快速封装对话、Agent、检索能力 langchain
第三方集成层 对接各大模型厂商、向量库、工具的专属集成包 langchain-openailangchain-anthropiclangchain-ollama

四、为什么选择 LangChain

仅单次调用模型 API 直接发 HTTP 请求即可,但搭建完整工业级 AI 应用,LangChain 具备不可替代优势:

表格

核心能力 功能描述 适用业务场景
统一模型调用接口 一套业务代码无缝切换 OpenAI/DeepSeek/Claude/ 本地 Ollama 等模型,快速做多模型对比、控制调用成本 多厂商模型兼容项目、线上成本优化、本地私有化部署
原生 Agent 智能架构 内置思考 - 行动循环,模型自主判断何时调用工具、选择工具、规划执行步骤 自动化办公助手、复杂智能客服、多步骤任务处理
可扩展中间件系统 支持在模型请求前后自定义拦截逻辑:失败重试、缓存问答、敏感词过滤、日志埋点 生产环境稳定 AI 服务、高并发线上系统
标准化结构化输出 强制模型返回 JSON / 列表等固定格式,无需手动正则解析文本 合同信息提取、表单自动填充、后端程序数据对接
完善记忆持久化方案 内置会话记忆,支持持久化存储用户历史对话、用户偏好 长会话 AI 助手、个性化智能客服
海量生态集成 数百种第三方工具、向量数据库、文档格式集成,开箱即用 快速落地知识库、自动化工具、私有化 AI 项目

五、LangChain 典型应用场景

1. 多轮智能聊天机器人

自带对话记忆,支持自动调用外部工具:查询天气、订单查询、发送邮件、数据查询等综合对话助手。

2. RAG 私有知识库问答

上传 PDF / 网页 / 内部文档,向量化存入向量库;用户提问时自动检索对应文档片段,让大模型基于私有资料作答并标注引用来源。

3. 自主规划 Agent 自动化助手

模型自主拆解复杂任务、分步调用对应工具完成全流程操作。 示例需求:整理上周销售数据、计算同比、自动生成可视化分析报告并发送邮件。

4. 非结构化数据提取与智能分析

从合同、票据、扫描文档中自动提取姓名、金额、日期等结构化字段;或基于海量文本自动生成数据分析总结。

六、LangChain 与 LangGraph 区别 & 关联

初学者极易混淆两个库,核心对比:

表格

对比维度 LangChain LangGraph
产品定位 高层封装 Agent 框架,开箱即用 底层图工作流引擎,精细管控流程
上手难度 低,少量代码快速搭建基础 Agent 中高,需要理解图、节点、状态流转概念
适用场景 标准 RAG、基础对话、快速原型验证 复杂分支流程、多 Agent 协同、带循环判断的任务
底层关系 LangChain 新版create_agent() 底层基于 LangGraph 实现 LangChain 底层依赖的流程引擎

学习建议:新手优先从 LangChain 入门;当业务需要复杂分支、循环、多智能体协作时,再学习 LangGraph。

七、学习前置准备

需掌握以下基础:

  1. Python 基础语法(函数、类、类型注解)
  2. 会使用 pip 安装第三方 Python 包
  3. 基础命令行操作能力
  4. 任意一款大模型 API Key(OpenAI、DeepSeek、Claude、本地 Ollama 均可)
  5. python版本推荐3.12
  6. 推荐初学者安装组合
    $ pip install langchain langchain-openai python-dotenv
    

八、简单示例

运行之前  需要在你的项目目录下 

创建一个“.env”文件,文件内容:

#openai兼容方式
HUNYUAN_API_KEY=sk-Sfzf12NTLpsddsdOoO1211Dv9NdYT3Dx38gBpeJ127IJHHyoyUTyH0121

import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI


# 加载环境变量
loaded = load_dotenv()
if not loaded:
    print("警告:.env 文件未找到")


model_hy: ChatOpenAI = ChatOpenAI(
    model="hunyuan-lite",
    api_key=os.getenv("HUNYUAN_API_KEY"),
    base_url="https://api.hunyuan.cloud.tencent.com/v1",
      # 温度
    temperature=1,
    # 关闭流式输出(对应 stream: false)
    streaming=False,
)


# 调用模型
response_hy = model_hy.invoke("rust语言后续发展如何")

print(response_hy.content)


九、常用网址

LangChain 官网: https://www.langchain.com/
LangChain Python 文档: https://python.langchain.com/
LangChain JavaScript 文档: https://js.langchain.com/
LangChain GitHub: https://github.com/langchain-ai/langchain 

官网有时候访问不了,就是访问python和js的就是可以获取相应的文档支持了

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐