# DeepSeek R1 本地部署完整教程（2026最新版）

本文详细介绍了如何在本地部署DeepSeekR1开源推理模型，通过Ollama工具实现隐私保护的离线AI应用。内容涵盖：环境要求：硬件配置（CPU/内存/显存）和软件环境安装步骤： Ollama一键安装（支持Linux/macOS/Windows）模型下载（7B/14B/70B版本选择）使用方式：终端对话 Python API调用（含流式输出和多轮对话示例） OpenWebUI搭建可视化

plutoest_

383人浏览 · 2026-06-03 20:28:21

plutoest_ · 2026-06-03 20:28:21 发布

> 🚀 手把手教你本地部署 DeepSeek R1，无需联网，保护隐私，支持 GPU/CPU 推理！

## 前言

DeepSeek R1 是 DeepSeek 推出的开源推理模型，在数学、代码、逻辑推理等任务上表现出色。本文将详细介绍如何在本地部署 DeepSeek R1，让你拥有自己的私人 AI 助手。

## 一、环境要求

### 硬件配置

| 配置项 | 最低要求 | 推荐配置 |

|--------|----------|----------|

| CPU | 8核 | 16核+ |

| 内存 | 16GB | 32GB+ |

| 显存 | 8GB (7B模型) | 24GB+ (70B模型) |

| 硬盘 | 50GB SSD | 100GB+ SSD |

### 软件环境

- 操作系统：Ubuntu 22.04 / Windows 10+ / macOS

- Python：3.10+

- CUDA：11.8+（NVIDIA 显卡）

- Git：最新版本

## 二、安装 Ollama（推荐方式）

Ollama 是最简单的本地大模型部署工具，一行命令即可运行。

### 2.1 Linux/macOS 安装

```bash

curl -fsSL https://ollama.ai/install.sh | sh

```

### 2.2 Windows 安装

访问 [Ollama 官网](https://ollama.ai) 下载 Windows 安装包，双击安装即可。

### 2.3 验证安装

```bash

ollama --version

# 输出：ollama version 0.x.x

```

## 三、下载并运行 DeepSeek R1

### 3.1 拉取模型

根据你的显存选择合适的模型版本：

```bash

# 7B 版本（适合 8GB 显存）

ollama pull deepseek-r1:7b

# 14B 版本（适合 16GB 显存）

ollama pull deepseek-r1:14b

# 70B 版本（适合 48GB+ 显存）

ollama pull deepseek-r1:70b

```

### 3.2 运行模型

```bash

ollama run deepseek-r1:7b

```

运行后即可在终端与 DeepSeek R1 对话：

```

>>> 你好，请介绍一下你自己

用户要求我介绍自己。我应该说明我是DeepSeek R1，一个AI助手。

</thinking>

你好！我是 DeepSeek R1，一个由 DeepSeek 开发的AI助手。我可以帮助你：

- 回答各种问题

- 编写和调试代码

- 数学计算和逻辑推理

- 文本创作和翻译

有什么我可以帮助你的吗？

```

### 3.3 常用命令

```bash

# 查看已下载的模型

ollama list

# 删除模型

ollama rm deepseek-r1:7b

# 查看模型信息

ollama show deepseek-r1:7b

# 停止运行中的模型

ollama stop deepseek-r1:7b

```

## 四、使用 Python 调用

### 4.1 安装依赖

```bash

pip install ollama

```

### 4.2 基础调用

```python

import ollama

# 简单对话

response = ollama.chat(

model='deepseek-r1:7b',

messages=[

{

'role': 'user',

'content': '用Python写一个快速排序算法'

}

]

)

print(response['message']['content'])

```

### 4.3 流式输出

```python

import ollama

stream = ollama.chat(

model='deepseek-r1:7b',

messages=[

{

'role': 'user',

'content': '解释什么是机器学习'

}

stream=True

)

for chunk in stream:

print(chunk['message']['content'], end='', flush=True)

```

### 4.4 多轮对话

```python

import ollama

# 维护对话历史

messages = [

{

'role': 'system',

'content': '你是一个专业的Python开发助手'

}

]

def chat(user_input):

messages.append({'role': 'user', 'content': user_input})

response = ollama.chat(

model='deepseek-r1:7b',

messages=messages

)

assistant_message = response['message']['content']

messages.append({'role': 'assistant', 'content': assistant_message})

return assistant_message

# 使用示例

print(chat("什么是装饰器？"))

print(chat("给我一个装饰器的实战例子"))

```

## 五、搭建 Web UI

### 5.1 安装 Open WebUI

```bash

# 使用 Docker 安装（推荐）

docker run -d -p 3000:8080 \

--add-host=host.docker.internal:host-gateway \

-v open-webui:/app/backend/data \

--name open-webui \

--restart always \

ghcr.io/open-webui/open-webui:main

```

### 5.2 访问界面

打开浏览器访问：`http://localhost:3000`

首次访问需要注册账号，之后即可在界面中选择 DeepSeek R1 模型进行对话。

## 六、性能优化技巧

### 6.1 使用量化模型

Ollama 默认使用 Q4_0 量化，如需更高精度：

```bash

# 使用 Q8_0 量化（精度更高，显存需求更大）

ollama pull deepseek-r1:7b-q8_0

```

### 6.2 调整推理参数

```python

response = ollama.chat(

model='deepseek-r1:7b',

messages=[{'role': 'user', 'content': '你好'}],

options={

'temperature': 0.7, # 温度（0-1），越低越确定

'top_p': 0.9, # 核采样

'num_ctx': 4096, # 上下文长度

'num_gpu': 999, # GPU 层数

'num_thread': 8 # CPU 线程数

}

)

```

### 6.3 显存不足的解决方案

1. **使用更小的模型**：7B → 1.5B

2. **增加量化级别**：Q4_0 → Q2_K

3. **使用 CPU 推理**：设置 `CUDA_VISIBLE_DEVICES=""`

## 七、常见问题

### Q1: 模型下载很慢怎么办？

```bash

# 设置国内镜像（如果有）

export OLLAMA_HOST=0.0.0.0

# 或使用代理

export https_proxy=http://your-proxy:port

```

### Q2: 运行时报错 CUDA out of memory

- 减小 `num_ctx` 上下文长度

- 使用更小的模型版本

- 关闭其他占用显存的程序

### Q3: 如何让局域网其他设备访问？

```bash

# 设置 Ollama 监听所有网络

OLLAMA_HOST=0.0.0.0 ollama serve

```

## 八、总结

| 部署方式 | 难度 | 适用场景 |

|----------|------|----------|

| Ollama | ⭐ | 新手入门、快速体验 |

| vLLM | ⭐⭐⭐ | 生产环境、高并发 |

| llama.cpp | ⭐⭐ | 嵌入式、低资源设备 |

本文推荐使用 Ollama 方式部署，简单快速，5分钟即可拥有自己的 AI 助手！

---

**相关资源**：

- [DeepSeek 官方文档](https://deepseek.com)

- [Ollama GitHub](https://github.com/ollama/ollama)

- [Open WebUI](https://github.com/open-webui/open-webui)

---

> 📝 作者：AI技术爱好者

> 📅 更新时间：2025年

> 🔖 标签：#DeepSeek #本地部署 #AI #大模型 #Ollama

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

Codex又又又更新了！这次似乎不需要Xcode了？Codex更新、Codex遥控器、Codex手机版、iOS Builder、Xcode替代方案、AI编程工具、Codex客户端下载、Mac远程控制、

AI编程社区

告别拖拽做工作流：两个Skill让Dify应用全流程自动化

AI编程社区

68%的Agent因“提前放弃“而失败——长时域任务的真正考验

AI编程社区

所有评论(0)

查看更多评论

plutoest_

@plutoest_

已为社区贡献3条内容

# DeepSeek R1 本地部署完整教程（2026最新版）

plutoest_

所有评论(0)

温馨提示：您尚未绑定手机号

plutoest_