1-LangChain 简介

雨师@

56人浏览 · 2026-06-22 12:18:03

雨师@ · 2026-06-22 12:18:03 发布

LangChain 完整简介

一、LangChain 是什么

LangChain 是一套用于构建大语言模型（LLM）应用的 Python 模块化开发框架。

核心定位

提供统一标准化接口对接各类大模型，可快速搭建具备工具调用、知识库检索、对话上下文记忆能力的智能 Agent。

解决的核心问题

原生大模型仅能基于训练数据生成文本，无法和外部世界交互；而实际业务需要 AI 完成：查询数据库、调用第三方 API、读取本地文档、联网搜索、发送消息等操作。 LangChain 封装全套标准化组件，快速串联各类外部能力，补齐 LLM 应用工程化能力。

二、LangChain 核心组件一览

表格

组件	作用	核心功能	常见用途
Models（模型层）	统一连接各类大语言模型	1. 标准化模型调用接口2. 一行代码切换不同模型3. 兼容 GPT/Claude/Gemini/DeepSeek/Ollama 等	通用聊天机器人、文本生成、基础 AI 问答
Prompts（提示词模板）	统一管理、复用提示词	1. 提示词参数化填充2. 动态变量替换3. 模板封装复用	多轮对话、批量内容生成、约束模型结构化输出
Document Loader（文档加载器）	读取各类外部文档数据源	1. 加载 PDF/TXT/DOCX/Markdown2. 抓取网页、读取数据库内容3. 统一文档数据格式	私有知识库搭建、RAG 检索系统、文档问答
Text Splitter（文本切分器）	对超长文本分段处理	1. 文本分片（Chunk）切割2. 精准控制 Token 长度3. 优化向量检索匹配效果	RAG 知识库、向量数据库存储、超长文档解析
Memory（记忆模块）	给对话增加上下文记忆能力	1. 自动保存聊天历史2. 支持短期 / 长期记忆持久化3. 维护完整对话状态	多轮聊天助手、智能客服、工具型 Agent
Retriever（检索器）	从知识库召回相关内容	1. 向量相似度搜索2. 语义匹配检索3. 过滤无关文档片段	企业私有知识库、本地文档问答、AI 本地搜索
Tools（工具集）	赋予模型调用外部能力	1. 联网搜索工具2. 数据库查询工具3. 代码执行、邮件发送等自定义 API	自主 Agent、自动化办公、智能数据分析
Output Parser（输出解析器）	规范、解析大模型返回内容	1. 强制结构化输出2. JSON / 表格格式化解析3. 输出格式校验	程序对接 API、表单信息提取、自动化数据处理
Chains（执行链）	串联多个组件形成完整工作流	1. 多步骤任务串行执行2. 自定义业务流程编排3. 组件灵活组合复用	完整 RAG 问答流程、复杂 AI 任务、自动化 Agent 系统

三、LangChain 三层技术架构

从底层到上层分为三层，分层解耦便于扩展、替换组件：

表格

分层	说明	对应 Python 包
核心抽象层	定义模型、消息、工具、文档等通用底层接口，无厂商绑定	`langchain-core`
用户接口层	提供开箱即用高阶 API，快速封装对话、Agent、检索能力	`langchain`
第三方集成层	对接各大模型厂商、向量库、工具的专属集成包	`langchain-openai`、`langchain-anthropic`、`langchain-ollama` 等

四、为什么选择 LangChain

仅单次调用模型 API 直接发 HTTP 请求即可，但搭建完整工业级 AI 应用，LangChain 具备不可替代优势：

表格

核心能力	功能描述	适用业务场景
统一模型调用接口	一套业务代码无缝切换 OpenAI/DeepSeek/Claude/ 本地 Ollama 等模型，快速做多模型对比、控制调用成本	多厂商模型兼容项目、线上成本优化、本地私有化部署
原生 Agent 智能架构	内置思考 - 行动循环，模型自主判断何时调用工具、选择工具、规划执行步骤	自动化办公助手、复杂智能客服、多步骤任务处理
可扩展中间件系统	支持在模型请求前后自定义拦截逻辑：失败重试、缓存问答、敏感词过滤、日志埋点	生产环境稳定 AI 服务、高并发线上系统
标准化结构化输出	强制模型返回 JSON / 列表等固定格式，无需手动正则解析文本	合同信息提取、表单自动填充、后端程序数据对接
完善记忆持久化方案	内置会话记忆，支持持久化存储用户历史对话、用户偏好	长会话 AI 助手、个性化智能客服
海量生态集成	数百种第三方工具、向量数据库、文档格式集成，开箱即用	快速落地知识库、自动化工具、私有化 AI 项目

五、LangChain 典型应用场景

1. 多轮智能聊天机器人

自带对话记忆，支持自动调用外部工具：查询天气、订单查询、发送邮件、数据查询等综合对话助手。

2. RAG 私有知识库问答

上传 PDF / 网页 / 内部文档，向量化存入向量库；用户提问时自动检索对应文档片段，让大模型基于私有资料作答并标注引用来源。

3. 自主规划 Agent 自动化助手

模型自主拆解复杂任务、分步调用对应工具完成全流程操作。示例需求：整理上周销售数据、计算同比、自动生成可视化分析报告并发送邮件。

4. 非结构化数据提取与智能分析

从合同、票据、扫描文档中自动提取姓名、金额、日期等结构化字段；或基于海量文本自动生成数据分析总结。

六、LangChain 与 LangGraph 区别 & 关联

初学者极易混淆两个库，核心对比：

表格

对比维度	LangChain	LangGraph
产品定位	高层封装 Agent 框架，开箱即用	底层图工作流引擎，精细管控流程
上手难度	低，少量代码快速搭建基础 Agent	中高，需要理解图、节点、状态流转概念
适用场景	标准 RAG、基础对话、快速原型验证	复杂分支流程、多 Agent 协同、带循环判断的任务
底层关系	LangChain 新版`create_agent()` 底层基于 LangGraph 实现	LangChain 底层依赖的流程引擎

学习建议：新手优先从 LangChain 入门；当业务需要复杂分支、循环、多智能体协作时，再学习 LangGraph。

七、学习前置准备

需掌握以下基础：

Python 基础语法（函数、类、类型注解）
会使用 pip 安装第三方 Python 包
基础命令行操作能力
任意一款大模型 API Key（OpenAI、DeepSeek、Claude、本地 Ollama 均可）
python版本推荐3.12

推荐初学者安装组合

$ pip install langchain langchain-openai python-dotenv

八、简单示例

运行之前需要在你的项目目录下

创建一个“.env”文件，文件内容：

#openai兼容方式
HUNYUAN_API_KEY=sk-Sfzf12NTLpsddsdOoO1211Dv9NdYT3Dx38gBpeJ127IJHHyoyUTyH0121


import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI


# 加载环境变量
loaded = load_dotenv()
if not loaded:
    print("警告：.env 文件未找到")


model_hy: ChatOpenAI = ChatOpenAI(
    model="hunyuan-lite",
    api_key=os.getenv("HUNYUAN_API_KEY"),
    base_url="https://api.hunyuan.cloud.tencent.com/v1",
      # 温度
    temperature=1,
    # 关闭流式输出（对应 stream: false）
    streaming=False,
)


# 调用模型
response_hy = model_hy.invoke("rust语言后续发展如何")

print(response_hy.content)

九、常用网址

LangChain 官网： https://www.langchain.com/
LangChain Python 文档： https://python.langchain.com/
LangChain JavaScript 文档： https://js.langchain.com/
LangChain GitHub： https://github.com/langchain-ai/langchain

官网有时候访问不了，就是访问python和js的就是可以获取相应的文档支持了

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

国内使用 Codex 配置教程：base_url 直接用 kkflow.org

AI编程社区

Sem 语义 Git 工具深度解析：AI Agent 代码理解的“新原语“与 2.3 倍准确率提升

它让 AI Agent 不再"看行"，而是"看实体"。如果你在构建 AI 代码审查流程：Sem 是必须品，不是奢侈品。2.3 倍的准确率提升意味着显著减少人工复核的工作量。如果你在用 Claude Code 或 Codex：通过 MCP 集成 Sem，让 Agent 的代码理解能力上一个台阶。如果你是工具开发者：Sem 的"实体级版本控制"范式值得关注。未来的 AI 编程工具很可能都会采用类似的思

AI编程社区

2026深度实测｜Cursor替代品有哪些，中文vibe coding迭代真实对比

TRAE拥有IDE模式、Work模式（原 SOLO 模式）、Builder模式、CUE智能预测四大核心功能，Work模式（原 SOLO 模式）提供Agent级别的自主开发能力，同时以完整IDE形态呈现，可视化和终端兼顾，也就是TRAE核心优势。①我的口语化需求：编写Python pandas脚本，读取知识付费课程订单csv日志，清洗订单空值、重复下单记录、字段首尾中文空格，筛选近14天付费订单，统