Ollama+EmbeddingGemma-300m：快速构建智能文档检索系统

赵子诺

137人浏览 · 2026-04-06 05:52:00

赵子诺 · 2026-04-06 05:52:00 发布

Ollama+EmbeddingGemma-300m：快速构建智能文档检索系统

想不想在本地电脑上搭建一个能理解语义的文档检索系统？不用依赖云端API，不用担心数据隐私，还能处理各种格式的文档？今天我们就来聊聊如何用Ollama部署EmbeddingGemma-300m模型，快速构建一个智能文档检索系统。

EmbeddingGemma-300m是谷歌推出的开源嵌入模型，虽然只有3亿参数，但基于先进的Gemma 3架构，能够将文本转换成高质量的向量表示。这些向量就像是文本的"数字指纹"，可以用来做语义搜索、文档分类和智能推荐。最棒的是，它足够轻量，能在普通笔记本电脑上流畅运行。

1. 环境准备与模型部署

1.1 安装Ollama

Ollama是一个强大的工具，能让你像下载应用一样在本地运行各种大语言模型。根据你的操作系统选择安装方式：

Windows/macOS用户：直接下载安装程序，双击运行即可
Linux用户：可以通过一行命令快速安装：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，打开终端输入以下命令验证是否安装成功：

ollama --version

1.2 拉取并运行EmbeddingGemma-300m模型

使用Ollama拉取模型非常简单，只需执行以下命令：

ollama pull embeddinggemma:300m

下载完成后，启动模型服务：

ollama run embeddinggemma:300m

看到模型成功加载后，你可以尝试输入一段文字，它会返回一个向量表示。不过命令行交互效率不高，我们需要一个更友好的界面。

2. 构建文档检索系统

2.1 文档处理流程

一个完整的智能文档检索系统通常包含以下几个步骤：

文档加载：支持各种格式的文档（PDF、Word、TXT等）
文本分割：将长文档分割成适合处理的片段
向量化：使用EmbeddingGemma生成文本向量
存储：将向量存入向量数据库
检索：根据查询返回最相关的文档

2.2 使用LangChain构建系统

我们可以使用LangChain框架来简化这个流程。首先安装必要的Python包：

pip install langchain langchain-community chromadb pypdf

然后创建一个简单的检索系统：

from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.embeddings import OllamaEmbeddings
from langchain_community.vectorstores import Chroma

# 加载PDF文档
loader = PyPDFLoader("example.pdf")
pages = loader.load()

# 分割文本
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200
)
splits = text_splitter.split_documents(pages)

# 初始化EmbeddingGemma嵌入模型
embeddings = OllamaEmbeddings(model="embeddinggemma:300m")

# 创建向量数据库
vectorstore = Chroma.from_documents(
    documents=splits,
    embedding=embeddings,
    persist_directory="./chroma_db"
)

# 检索文档
query = "人工智能的最新发展"
docs = vectorstore.similarity_search(query)
print(docs[0].page_content)

3. 批量处理文档

3.1 支持多种文档格式

在实际应用中，我们通常需要处理各种格式的文档。LangChain提供了多种文档加载器：

# Word文档
from langchain_community.document_loaders import Docx2txtLoader
loader = Docx2txtLoader("example.docx")

# 纯文本
from langchain_community.document_loaders import TextLoader
loader = TextLoader("example.txt")

# 网页内容
from langchain_community.document_loaders import WebBaseLoader
loader = WebBaseLoader("https://example.com")

3.2 批量处理文件夹

对于大量文档，我们可以批量处理整个文件夹：

from langchain_community.document_loaders import DirectoryLoader

loader = DirectoryLoader(
    "./docs",
    glob="**/*.pdf",
    loader_cls=PyPDFLoader
)
documents = loader.load()