Ollama 相关命令

晚夜微雨问海棠呀

113人浏览 · 2026-05-14 18:42:28

晚夜微雨问海棠呀 · 2026-05-14 18:42:28 发布

Ollama 常用命令大全

1. 模型管理

下载与拉取

# 下载指定模型
ollama pull llama3

# 下载特定版本
ollama pull llama3:8b
ollama pull qwen2:7b

# 下载量化版本（节省空间）
ollama pull llama3:8b-q4_0
ollama pull llama3:8b-q5_K_M

# 从镜像源下载（如需要）
OLLAMA_PROXY=http://your-proxy:port ollama pull llama3

查看模型

# 列出所有已下载模型
ollama list

# 查看模型详细信息
ollama show llama3

# 查看模型参数和配置
ollama show --modelfile llama3

# 查看模型大小和占用空间
ollama list --format json

删除模型

# 删除指定模型
ollama rm llama3

# 删除特定版本
ollama rm llama3:8b

# 批量删除（需脚本）
ollama list | grep llama3 | awk '{print $1}' | xargs -I {} ollama rm {}

复制模型

# 创建模型副本
ollama cp llama3 my-llama3

# 复制特定版本
ollama cp llama3:8b my-llama3:latest

2. 运行与交互

基础运行

# 交互式运行
ollama run llama3

# 运行特定版本
ollama run llama3:8b

# 单条命令运行
ollama run llama3 "解释量子力学"

# 从标准输入读取
echo "写一首诗" | ollama run llama3

# 从文件读取
ollama run llama3 < prompt.txt

参数控制

# 设置温度（0.0-2.0，越高越随机）
ollama run llama3 --temperature 0.7

# 设置最大生成 token 数
ollama run llama3 --num-predict 500

# 设置上下文窗口大小
ollama run llama3 --num-context 4096

# 设置重复惩罚
ollama run llama3 --repeat-penalty 1.1

# 多参数组合
ollama run llama3 --temperature 0.5 --num-predict 1000 --num-context 8192

会话控制

# 保持会话时间
ollama run llama3 --keepalive 30m

# 在交互模式中：
# /bye          - 退出
# /help         - 显示帮助
# /show info    - 显示模型信息
# /set parameter temperature 0.5  - 设置参数
# /set system "你是一位..."       - 设置系统提示词

3. 模型创建与自定义

创建 Modelfile

# 基础示例
FROM llama3
PARAMETER temperature 0.7
PARAMETER num_predict 1000
SYSTEM You are a helpful assistant.

创建自定义模型

# 从现有模型创建
ollama create my-model -f Modelfile

# 从文件创建（支持 .gguf 格式）
ollama create my-model -f ./model.gguf

# 创建多模态模型
ollama create my-model -f Modelfile

修改模型参数

# 基于现有模型修改参数
ollama create my-llama3 -f - <<EOF
FROM llama3
PARAMETER temperature 0.5
PARAMETER num_ctx 8192
SYSTEM You are a coding assistant.
EOF

4. API 与服务管理

启动服务

# 启动 Ollama 服务
ollama serve

# 指定主机和端口
OLLAMA_HOST=127.0.0.1:11435 ollama serve

# 后台运行（Linux/macOS）
nohup ollama serve > ollama.log 2>&1 &

# Windows 后台运行
start /B ollama serve

API 调用示例

# 生成补全
curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "Hello",
  "stream": false
}'

# 对话补全
curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [
    {"role": "user", "content": "你好"}
  ],
  "stream": false
}'

# 流式输出
curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [{"role": "user", "content": "写故事"}],
  "stream": true
}'

# 检查模型是否加载
curl http://localhost:11434/api/tags

# 获取系统信息
curl http://localhost:11434/api/version

服务控制

# 查看服务状态
ollama ps

# 停止服务（Linux/macOS）
killall ollama

# Windows 停止
taskkill /F /IM ollama.exe

5. 系统管理

环境变量

# 设置代理
export OLLAMA_PROXY="http://proxy:port"

# 设置模型存储目录
export OLLAMA_MODELS="/path/to/models"

# 设置主机地址
export OLLAMA_HOST="0.0.0.0:11434"

# 设置最大并发数
export OLLAMA_NUM_PARALLEL=4

# 设置最大内存使用
export OLLAMA_MAX_LOADED_MODELS=2

# Windows (PowerShell)
$env:OLLAMA_PROXY="http://proxy:port"
$env:OLLAMA_MODELS="D:\ollama\models"

服务管理（Linux）

# 启动服务
sudo systemctl start ollama

# 停止服务
sudo systemctl stop ollama

# 重启服务
sudo systemctl restart ollama

# 设置开机自启
sudo systemctl enable ollama

# 查看服务状态
sudo systemctl status ollama

# 查看日志
sudo journalctl -u ollama -f

服务管理（macOS）

# 启动服务
launchctl start com.ollama

# 停止服务
launchctl stop com.ollama

# 查看状态
launchctl list | grep ollama

服务管理（Windows）

# 启动服务
Start-Service ollama

# 停止服务
Stop-Service ollama

# 重启服务
Restart-Service ollama

# 设置开机自启
Set-Service ollama -StartupType Automatic

6. 实用工具命令

查看帮助

# 显示所有命令
ollama --help

# 查看具体命令帮助
ollama run --help
ollama pull --help
ollama create --help

版本信息

# 查看版本
ollama --version

# 查看详细信息
ollama version

清理缓存

# 清理未使用的模型层
ollama prune

# 清理所有缓存（谨慎使用）
rm -rf ~/.ollama/blobs

导入模型

# 从 GGUF 文件导入
ollama create my-model -f ./model.gguf

# 从 Ollama 模型导出（需脚本）
ollama show --modelfile llama3 > Modelfile

7. 批量操作脚本

批量下载模型

#!/bin/bash
MODELS=("llama3:8b" "qwen2:7b" "mistral:7b" "gemma:2b")

for model in "${MODELS[@]}"; do
  echo "下载：$model"
  ollama pull $model
done

批量测试模型

#!/bin/bash
PROMPT="用一句话介绍自己"

for model in $(ollama list | tail -n +2 | awk '{print $1}'); do
  echo "测试模型：$model"
  ollama run $model "$PROMPT" --temperature 0.5
  echo "---"
done

清理旧模型

#!/bin/bash
# 删除超过 30 天未使用的模型
ollama list | tail -n +2 | while read model size date; do
  # 这里可以添加日期判断逻辑
  echo "准备删除：$model"
  # ollama rm $model
done

8. 诊断与调试

检查系统兼容性

# 查看 GPU 使用情况
ollama ps

# 查看模型加载状态
ollama list

# 测试模型运行
ollama run llama3 "测试" --num-predict 10

日志查看

# 查看服务日志（Linux）
sudo journalctl -u ollama -f

# 查看应用日志
tail -f ~/.ollama/logs/server.log

# Windows 日志
Get-Content $env:APPDATA\ollama\logs\server.log -Tail 50 -Wait

网络诊断

# 检查服务是否运行
curl http://localhost:11434/api/version

# 检查端口占用
netstat -an | grep 11434

# Windows
netstat -an | findstr 11434

这些命令涵盖了 Ollama 的主要功能。建议先掌握 pull、run、list、rm 等基础命令，再逐步学习高级功能。

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

大模型评测与AI产品质量保障：第4篇主流大模型全景图比较

AI编程社区

大模型核心技术与企业级应用实战指南-附录

这篇文章摘要如下：《附录：AI术语速查手册》整理了人工智能领域的核心概念和工具，涵盖从基础算法到前沿技术的150+个关键术语。内容按字母顺序编排，包含术语定义、技术原理和典型应用场景，如Transformer架构、注意力机制、RAG系统等。手册特别标注了ChatGPT、BERT等主流模型的技术特点，以及LoRA微调、思维链提示等实用技巧，同时解释困惑度、BLEU等评估指标。作为工具性附录，它既可