3亿参数开源嵌入模型来了！embeddinggemma-300m + ollama 零基础部署教程

本文介绍了如何在星图GPU平台上自动化部署【ollama】embeddinggemma-300m镜像，实现高效的文本嵌入生成。该3亿参数开源模型能将文本转换为语义向量，典型应用于构建智能文档搜索系统，通过计算文本相似度快速检索相关内容，提升信息处理效率。

大苏牙

289人浏览 · 2026-05-08 03:41:03

大苏牙 · 2026-05-08 03:41:03 发布

3亿参数开源嵌入模型来了！embeddinggemma-300m + ollama 零基础部署教程

1. 快速了解embeddinggemma-300m

EmbeddingGemma是谷歌推出的开源嵌入模型，参数量达到3亿，在业界属于领先水平。这个模型基于Gemma 3架构，采用了与构建Gemini系列模型相同的研发技术。

简单来说，嵌入模型就像是一个"文本翻译器"，它能把文字转换成计算机能理解的数字向量。比如"苹果"这个词，模型会把它转换成一串有意义的数字，这样计算机就能知道"苹果"和"水果"比较接近，而和"汽车"相差较远。

EmbeddingGemma特别适合用于：

搜索和检索任务：帮你快速找到相关内容
文本分类：自动给文章打标签
聚类分析：发现文本之间的相似性
语义相似度搜索：找到意思相近的内容

这个模型使用了100多种语言的数据进行训练，所以对多语言支持很好。最棒的是它体积小巧，完全可以在普通电脑、笔记本甚至手机上运行，让每个人都能用上先进的AI技术。

embeddinggemma模型示意图

2. 环境准备与ollama安装

2.1 系统要求

在开始之前，确保你的设备满足以下要求：

操作系统：Windows 10/11、macOS 10.14+ 或 Linux Ubuntu 18.04+
内存：至少8GB RAM（推荐16GB）
存储空间：至少2GB可用空间
网络：需要能正常访问互联网

2.2 安装ollama

Ollama是一个专门用于本地运行大模型的工具，安装非常简单：

Windows系统安装：

访问Ollama官网下载Windows版本
双击安装包，按照提示完成安装
安装完成后，打开命令提示符或PowerShell

macOS系统安装：

# 使用Homebrew安装
brew install ollama

# 或者直接下载安装包
# 访问Ollama官网下载macOS版本

Linux系统安装：

# 使用一键安装脚本
curl -fsSL https://ollama.com/install.sh | sh

安装完成后，在终端输入以下命令检查是否安装成功：

ollama --version

如果显示版本号，说明安装成功。

3. 部署embeddinggemma-300m模型

3.1 拉取模型

现在我们来下载embeddinggemma-300m模型。打开终端或命令提示符，输入以下命令：

ollama pull embeddinggemma:300m

这个过程可能会需要一些时间，取决于你的网速。模型大小约1.2GB，所以请耐心等待下载完成。

3.2 运行模型服务

下载完成后，启动模型服务：

ollama run embeddinggemma:300m

第一次运行时会自动完成一些初始化工作。看到类似下面的输出，说明模型已经成功运行：

>>> Send a message (/? for help)

现在你的本地嵌入模型服务已经启动并运行了！

3.3 后台运行服务

如果你希望模型在后台持续运行，可以使用这个命令：

ollama serve

这样模型服务就会在后台运行，你可以继续使用终端做其他事情。

4. 使用webui界面操作

4.1 打开webui界面

Ollama提供了一个漂亮的网页界面，让你可以直观地操作模型：

确保ollama服务正在运行
打开浏览器，访问：http://localhost:11434
你应该能看到Ollama的Web界面

webui界面示意图

这个界面非常友好，左侧是聊天窗口，右侧可以查看和管理模型。

4.2 进行相似度验证

现在我们用实际例子来测试模型的相似度计算功能。在Web界面的输入框中，你可以尝试以下示例：

示例1：测试同义词相似度

请计算"快乐"和"高兴"的相似度

示例2：测试相关概念

比较"电脑"和"键盘"的相似程度

示例3：测试不相关词汇

分析"汽车"和"香蕉"的语义距离

模型会返回相似度分数，分数越接近1表示越相似，越接近0表示越不相关。

相似度验证示意图

5. 代码调用示例

5.1 Python调用示例

如果你想要在Python程序中使用这个嵌入模型，可以这样操作：

首先安装必要的库：

pip install requests

然后使用以下代码调用模型：

import requests
import json

def get_embedding(text):
    """获取文本的嵌入向量"""
    url = "http://localhost:11434/api/embeddings"
    payload = {
        "model": "embeddinggemma:300m",
        "prompt": text
    }
    
    response = requests.post(url, json=payload)
    if response.status_code == 200:
        return response.json()['embedding']
    else:
        print(f"错误: {response.status_code}")
        return None

# 示例：获取两个文本的嵌入并计算相似度
text1 = "人工智能技术"
text2 = "机器学习算法"

embedding1 = get_embedding(text1)
embedding2 = get_embedding(text2)

if embedding1 and embedding2:
    # 计算余弦相似度（简单版本）
    import numpy as np
    dot_product = np.dot(embedding1, embedding2)
    norm1 = np.linalg.norm(embedding1)
    norm2 = np.linalg.norm(embedding2)
    similarity = dot_product / (norm1 * norm2)
    
    print(f"'{text1}' 和 '{text2}' 的相似度: {similarity:.4f}")

5.2 批量处理示例

如果你需要处理大量文本，可以使用批量处理：

def batch_embedding(texts):
    """批量获取文本嵌入"""
    embeddings = []
    for text in texts:
        embedding = get_embedding(text)
        if embedding:
            embeddings.append(embedding)
        # 避免请求过快，添加短暂延迟
        time.sleep(0.1)
    return embeddings

# 示例用法
documents = [
    "今天天气真好",
    "阳光明媚的一天", 
    "编程很有趣",
    "人工智能改变世界"
]

doc_embeddings = batch_embedding(documents)
print(f"成功生成 {len(doc_embeddings)} 个嵌入向量")

6. 实际应用场景

6.1 文档搜索系统

你可以用embeddinggemma构建一个简单的文档搜索系统：

class SimpleSearchEngine:
    def __init__(self):
        self.documents = []
        self.embeddings = []
    
    def add_document(self, text):
        """添加文档到搜索库"""
        embedding = get_embedding(text)
        if embedding:
            self.documents.append(text)
            self.embeddings.append(embedding)
    
    def search(self, query, top_k=3):
        """搜索相关文档"""
        query_embedding = get_embedding(query)
        if not query_embedding:
            return []
        
        # 计算相似度
        similarities = []
        for emb in self.embeddings:
            similarity = np.dot(query_embedding, emb) / (
                np.linalg.norm(query_embedding) * np.linalg.norm(emb))
            similarities.append(similarity)
        
        # 获取最相似的前k个文档
        indices = np.argsort(similarities)[-top_k:][::-1]
        results = [(self.documents[i], similarities[i]) for i in indices]
        return results

# 使用示例
search_engine = SimpleSearchEngine()
search_engine.add_document("机器学习是人工智能的重要分支")
search_engine.add_document("深度学习使用神经网络处理复杂任务")
search_engine.add_document("天气预报说今天会下雨")

results = search_engine.search("人工智能技术", top_k=2)
for doc, score in results:
    print(f"相似度: {score:.3f} - 内容: {doc}")

6.2 文本分类器

你还可以用嵌入向量来做文本分类：

from sklearn.ensemble import RandomForestClassifier
import numpy as np

# 准备训练数据
training_texts = [
    "我喜欢这部电影", "很好的产品", "服务很棒",
    "不喜欢这个", "质量很差", "糟糕的体验"
]
training_labels = [1, 1, 1, 0, 0, 0]  # 1=正面, 0=负面

# 生成嵌入向量
X_train = [get_embedding(text) for text in training_texts]

# 训练分类器
classifier = RandomForestClassifier()
classifier.fit(X_train, training_labels)

# 预测新文本
test_text = "这个真的很不错"
test_embedding = get_embedding(test_text)
prediction = classifier.predict([test_embedding])

print(f"文本: '{test_text}'")
print(f"预测情感: {'正面' if prediction[0] == 1 else '负面'}")