# DeepSeek R1 本地部署完整教程(2026最新版)
本文详细介绍了如何在本地部署DeepSeekR1开源推理模型,通过Ollama工具实现隐私保护的离线AI应用。内容涵盖: 环境要求:硬件配置(CPU/内存/显存)和软件环境 安装步骤: Ollama一键安装(支持Linux/macOS/Windows) 模型下载(7B/14B/70B版本选择) 使用方式: 终端对话 Python API调用(含流式输出和多轮对话示例) OpenWebUI搭建可视化
> 🚀 手把手教你本地部署 DeepSeek R1,无需联网,保护隐私,支持 GPU/CPU 推理!
## 前言
DeepSeek R1 是 DeepSeek 推出的开源推理模型,在数学、代码、逻辑推理等任务上表现出色。本文将详细介绍如何在本地部署 DeepSeek R1,让你拥有自己的私人 AI 助手。
## 一、环境要求
### 硬件配置
| 配置项 | 最低要求 | 推荐配置 |
|--------|----------|----------|
| CPU | 8核 | 16核+ |
| 内存 | 16GB | 32GB+ |
| 显存 | 8GB (7B模型) | 24GB+ (70B模型) |
| 硬盘 | 50GB SSD | 100GB+ SSD |
### 软件环境
- 操作系统:Ubuntu 22.04 / Windows 10+ / macOS
- Python:3.10+
- CUDA:11.8+(NVIDIA 显卡)
- Git:最新版本
## 二、安装 Ollama(推荐方式)
Ollama 是最简单的本地大模型部署工具,一行命令即可运行。
### 2.1 Linux/macOS 安装
```bash
curl -fsSL https://ollama.ai/install.sh | sh
```
### 2.2 Windows 安装
访问 [Ollama 官网](https://ollama.ai) 下载 Windows 安装包,双击安装即可。
### 2.3 验证安装
```bash
ollama --version
# 输出:ollama version 0.x.x
```
## 三、下载并运行 DeepSeek R1
### 3.1 拉取模型
根据你的显存选择合适的模型版本:
```bash
# 7B 版本(适合 8GB 显存)
ollama pull deepseek-r1:7b
# 14B 版本(适合 16GB 显存)
ollama pull deepseek-r1:14b
# 70B 版本(适合 48GB+ 显存)
ollama pull deepseek-r1:70b
```
### 3.2 运行模型
```bash
ollama run deepseek-r1:7b
```
运行后即可在终端与 DeepSeek R1 对话:
```
>>> 你好,请介绍一下你自己
<thinking>
用户要求我介绍自己。我应该说明我是DeepSeek R1,一个AI助手。
</thinking>
你好!我是 DeepSeek R1,一个由 DeepSeek 开发的AI助手。我可以帮助你:
- 回答各种问题
- 编写和调试代码
- 数学计算和逻辑推理
- 文本创作和翻译
有什么我可以帮助你的吗?
```
### 3.3 常用命令
```bash
# 查看已下载的模型
ollama list
# 删除模型
ollama rm deepseek-r1:7b
# 查看模型信息
ollama show deepseek-r1:7b
# 停止运行中的模型
ollama stop deepseek-r1:7b
```
## 四、使用 Python 调用
### 4.1 安装依赖
```bash
pip install ollama
```
### 4.2 基础调用
```python
import ollama
# 简单对话
response = ollama.chat(
model='deepseek-r1:7b',
messages=[
{
'role': 'user',
'content': '用Python写一个快速排序算法'
}
]
)
print(response['message']['content'])
```
### 4.3 流式输出
```python
import ollama
stream = ollama.chat(
model='deepseek-r1:7b',
messages=[
{
'role': 'user',
'content': '解释什么是机器学习'
}
],
stream=True
)
for chunk in stream:
print(chunk['message']['content'], end='', flush=True)
```
### 4.4 多轮对话
```python
import ollama
# 维护对话历史
messages = [
{
'role': 'system',
'content': '你是一个专业的Python开发助手'
}
]
def chat(user_input):
messages.append({'role': 'user', 'content': user_input})
response = ollama.chat(
model='deepseek-r1:7b',
messages=messages
)
assistant_message = response['message']['content']
messages.append({'role': 'assistant', 'content': assistant_message})
return assistant_message
# 使用示例
print(chat("什么是装饰器?"))
print(chat("给我一个装饰器的实战例子"))
```
## 五、搭建 Web UI
### 5.1 安装 Open WebUI
```bash
# 使用 Docker 安装(推荐)
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main
```
### 5.2 访问界面
打开浏览器访问:`http://localhost:3000`
首次访问需要注册账号,之后即可在界面中选择 DeepSeek R1 模型进行对话。
## 六、性能优化技巧
### 6.1 使用量化模型
Ollama 默认使用 Q4_0 量化,如需更高精度:
```bash
# 使用 Q8_0 量化(精度更高,显存需求更大)
ollama pull deepseek-r1:7b-q8_0
```
### 6.2 调整推理参数
```python
response = ollama.chat(
model='deepseek-r1:7b',
messages=[{'role': 'user', 'content': '你好'}],
options={
'temperature': 0.7, # 温度(0-1),越低越确定
'top_p': 0.9, # 核采样
'num_ctx': 4096, # 上下文长度
'num_gpu': 999, # GPU 层数
'num_thread': 8 # CPU 线程数
}
)
```
### 6.3 显存不足的解决方案
1. **使用更小的模型**:7B → 1.5B
2. **增加量化级别**:Q4_0 → Q2_K
3. **使用 CPU 推理**:设置 `CUDA_VISIBLE_DEVICES=""`
## 七、常见问题
### Q1: 模型下载很慢怎么办?
```bash
# 设置国内镜像(如果有)
export OLLAMA_HOST=0.0.0.0
# 或使用代理
export https_proxy=http://your-proxy:port
```
### Q2: 运行时报错 CUDA out of memory
- 减小 `num_ctx` 上下文长度
- 使用更小的模型版本
- 关闭其他占用显存的程序
### Q3: 如何让局域网其他设备访问?
```bash
# 设置 Ollama 监听所有网络
OLLAMA_HOST=0.0.0.0 ollama serve
```
## 八、总结
| 部署方式 | 难度 | 适用场景 |
|----------|------|----------|
| Ollama | ⭐ | 新手入门、快速体验 |
| vLLM | ⭐⭐⭐ | 生产环境、高并发 |
| llama.cpp | ⭐⭐ | 嵌入式、低资源设备 |
本文推荐使用 Ollama 方式部署,简单快速,5分钟即可拥有自己的 AI 助手!
---
**相关资源**:
- [DeepSeek 官方文档](https://deepseek.com)
- [Ollama GitHub](https://github.com/ollama/ollama)
- [Open WebUI](https://github.com/open-webui/open-webui)
---
> 📝 作者:AI技术爱好者
> 📅 更新时间:2025年
> 🔖 标签:#DeepSeek #本地部署 #AI #大模型 #Ollama
更多推荐




所有评论(0)