Ollama本地部署AI模型详细指南

青春的苦涩

601人浏览 · 2025-11-01 23:23:54

青春的苦涩 · 2025-11-01 23:23:54 发布

Ollama本地部署AI模型详细指南

引言

简要介绍Ollama的核心功能及其在AI模型本地部署中的优势
说明本地部署的意义（隐私保护、离线使用、定制化开发等）
目标读者群体（开发者、研究者、技术爱好者）

Ollama基础概念

访问官网：前往 Ollama 官网。
选择版本：点击页面上的 “Download” 按钮。它会自动识别你的操作系统（Windows、macOS 或 Linux）。如果你想下载其他系统的版本，可以点击 “All platforms” 进行选择。

安装：

Windows：运行下载的 .exe安装程序，按提示完成安装。
macOS：将下载的 .dmg文件拖入 “Applications” 文件夹。
Linux：按照官网提供的命令行指令进行安装。

第二步：启动与验证

启动 Ollama：

Windows/macOS：在开始菜单或启动台中找到 “Ollama” 并点击运行。它会常驻在系统托盘（右下角）或菜单栏（右上角）。
Linux：在终端中输入 ollama serve启动服务。

验证是否运行成功：

打开你的浏览器，访问 http://localhost:11434。
如果看到类似 "Ollama is running"的提示，说明服务已成功启动。这是 Ollama 的本地 API 地址。

第三步：下载（拉取）模型

这是核心步骤。你可以通过两种方式下载模型：
方式一：通过桌面界面（最简单）
- 点击系统托盘/菜单栏中的 Ollama 图标。
- 选择 “View logs & pulls”，这会打开一个命令行窗口。
- 在命令窗口中，输入拉取模型的命令，例如：
- ollama pull qwen2.5:7b
- 然后按回车。它会开始下载模型，你需要等待下载完成。
方式二：通过命令行/终端（通用）
- 直接打开你的终端（Command Prompt, Terminal, PowerShell 等）。
- 输入拉取模型的命令，例如：ollama pull qwen2.5:7b

# 运行
ollama run qwen2.5:7b

# 查看已下载模型
ollama list

# 删除旧模型释放空间
ollama rm qwen2.5:7b

# 更新模型到最新版
ollama pull qwen2.5:7b

与Python结合：安装pip install openai
测试代码：

from openai import OpenAI
import time

# 配置本地Ollama服务
client = OpenAI(
    base_url="http://localhost:11434/v1",
    api_key="ollama"  # 任意非空字符串即可
)

def query_ollama(prompt: str, model: str = "deepseek-r1:8b", max_tokens=512):
    try:
        response = client.chat.completions.create(
            model=model,
            messages=[{"role": "user", "content": prompt}],
            temperature=0.7,
            max_tokens=max_tokens,
            stream=False  # 关闭流式获取完整响应
        )
        return response.choices[0].message.content
    except Exception as e:
        return f"Error: {str(e)}"

# 测试调用
if __name__ == "__main__":
    test_prompt = "你能做什么"
    start_time = time.time()
    result = query_ollama(test_prompt)
    print(f"Response (耗时 {time.time()-start_time:.2f}s):\n{result}")

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

# Codex CLI 配置笔记：自定义 Base URL、API Key 和默认模型

AI编程社区

AI推荐榜单变了，你的品牌还在原来的位置吗？——2026年GEO监测工具实战指南

AI编程社区

大模型核心概念梳理

这篇文章系统性地解析了大模型应用开发中的核心概念体系。文章从模型底座（如GPT、Claude等预训练模型）作为无状态推理引擎出发，逐步拆解了上下文（工作记忆）、Harness（运行框架）、Loop（多步迭代）、ToolUse（工具调用）、MCP（标准化工具协议）、Agent（自主执行体）和Skill（领域专长）等关键组件的功能边界与协作关系。重点阐明了"模型本身无状态"的本质特