Ollama 相关命令
·
Ollama 常用命令大全
1. 模型管理
下载与拉取
# 下载指定模型
ollama pull llama3
# 下载特定版本
ollama pull llama3:8b
ollama pull qwen2:7b
# 下载量化版本(节省空间)
ollama pull llama3:8b-q4_0
ollama pull llama3:8b-q5_K_M
# 从镜像源下载(如需要)
OLLAMA_PROXY=http://your-proxy:port ollama pull llama3
查看模型
# 列出所有已下载模型
ollama list
# 查看模型详细信息
ollama show llama3
# 查看模型参数和配置
ollama show --modelfile llama3
# 查看模型大小和占用空间
ollama list --format json
删除模型
# 删除指定模型
ollama rm llama3
# 删除特定版本
ollama rm llama3:8b
# 批量删除(需脚本)
ollama list | grep llama3 | awk '{print $1}' | xargs -I {} ollama rm {}
复制模型
# 创建模型副本
ollama cp llama3 my-llama3
# 复制特定版本
ollama cp llama3:8b my-llama3:latest
2. 运行与交互
基础运行
# 交互式运行
ollama run llama3
# 运行特定版本
ollama run llama3:8b
# 单条命令运行
ollama run llama3 "解释量子力学"
# 从标准输入读取
echo "写一首诗" | ollama run llama3
# 从文件读取
ollama run llama3 < prompt.txt
参数控制
# 设置温度(0.0-2.0,越高越随机)
ollama run llama3 --temperature 0.7
# 设置最大生成 token 数
ollama run llama3 --num-predict 500
# 设置上下文窗口大小
ollama run llama3 --num-context 4096
# 设置重复惩罚
ollama run llama3 --repeat-penalty 1.1
# 多参数组合
ollama run llama3 --temperature 0.5 --num-predict 1000 --num-context 8192
会话控制
# 保持会话时间
ollama run llama3 --keepalive 30m
# 在交互模式中:
# /bye - 退出
# /help - 显示帮助
# /show info - 显示模型信息
# /set parameter temperature 0.5 - 设置参数
# /set system "你是一位..." - 设置系统提示词
3. 模型创建与自定义
创建 Modelfile
# 基础示例
FROM llama3
PARAMETER temperature 0.7
PARAMETER num_predict 1000
SYSTEM You are a helpful assistant.
创建自定义模型
# 从现有模型创建
ollama create my-model -f Modelfile
# 从文件创建(支持 .gguf 格式)
ollama create my-model -f ./model.gguf
# 创建多模态模型
ollama create my-model -f Modelfile
修改模型参数
# 基于现有模型修改参数
ollama create my-llama3 -f - <<EOF
FROM llama3
PARAMETER temperature 0.5
PARAMETER num_ctx 8192
SYSTEM You are a coding assistant.
EOF
4. API 与服务管理
启动服务
# 启动 Ollama 服务
ollama serve
# 指定主机和端口
OLLAMA_HOST=127.0.0.1:11435 ollama serve
# 后台运行(Linux/macOS)
nohup ollama serve > ollama.log 2>&1 &
# Windows 后台运行
start /B ollama serve
API 调用示例
# 生成补全
curl http://localhost:11434/api/generate -d '{
"model": "llama3",
"prompt": "Hello",
"stream": false
}'
# 对话补全
curl http://localhost:11434/api/chat -d '{
"model": "llama3",
"messages": [
{"role": "user", "content": "你好"}
],
"stream": false
}'
# 流式输出
curl http://localhost:11434/api/chat -d '{
"model": "llama3",
"messages": [{"role": "user", "content": "写故事"}],
"stream": true
}'
# 检查模型是否加载
curl http://localhost:11434/api/tags
# 获取系统信息
curl http://localhost:11434/api/version
服务控制
# 查看服务状态
ollama ps
# 停止服务(Linux/macOS)
killall ollama
# Windows 停止
taskkill /F /IM ollama.exe
5. 系统管理
环境变量
# 设置代理
export OLLAMA_PROXY="http://proxy:port"
# 设置模型存储目录
export OLLAMA_MODELS="/path/to/models"
# 设置主机地址
export OLLAMA_HOST="0.0.0.0:11434"
# 设置最大并发数
export OLLAMA_NUM_PARALLEL=4
# 设置最大内存使用
export OLLAMA_MAX_LOADED_MODELS=2
# Windows (PowerShell)
$env:OLLAMA_PROXY="http://proxy:port"
$env:OLLAMA_MODELS="D:\ollama\models"
服务管理(Linux)
# 启动服务
sudo systemctl start ollama
# 停止服务
sudo systemctl stop ollama
# 重启服务
sudo systemctl restart ollama
# 设置开机自启
sudo systemctl enable ollama
# 查看服务状态
sudo systemctl status ollama
# 查看日志
sudo journalctl -u ollama -f
服务管理(macOS)
# 启动服务
launchctl start com.ollama
# 停止服务
launchctl stop com.ollama
# 查看状态
launchctl list | grep ollama
服务管理(Windows)
# 启动服务
Start-Service ollama
# 停止服务
Stop-Service ollama
# 重启服务
Restart-Service ollama
# 设置开机自启
Set-Service ollama -StartupType Automatic
6. 实用工具命令
查看帮助
# 显示所有命令
ollama --help
# 查看具体命令帮助
ollama run --help
ollama pull --help
ollama create --help
版本信息
# 查看版本
ollama --version
# 查看详细信息
ollama version
清理缓存
# 清理未使用的模型层
ollama prune
# 清理所有缓存(谨慎使用)
rm -rf ~/.ollama/blobs
导入模型
# 从 GGUF 文件导入
ollama create my-model -f ./model.gguf
# 从 Ollama 模型导出(需脚本)
ollama show --modelfile llama3 > Modelfile
7. 批量操作脚本
批量下载模型
#!/bin/bash
MODELS=("llama3:8b" "qwen2:7b" "mistral:7b" "gemma:2b")
for model in "${MODELS[@]}"; do
echo "下载:$model"
ollama pull $model
done
批量测试模型
#!/bin/bash
PROMPT="用一句话介绍自己"
for model in $(ollama list | tail -n +2 | awk '{print $1}'); do
echo "测试模型:$model"
ollama run $model "$PROMPT" --temperature 0.5
echo "---"
done
清理旧模型
#!/bin/bash
# 删除超过 30 天未使用的模型
ollama list | tail -n +2 | while read model size date; do
# 这里可以添加日期判断逻辑
echo "准备删除:$model"
# ollama rm $model
done
8. 诊断与调试
检查系统兼容性
# 查看 GPU 使用情况
ollama ps
# 查看模型加载状态
ollama list
# 测试模型运行
ollama run llama3 "测试" --num-predict 10
日志查看
# 查看服务日志(Linux)
sudo journalctl -u ollama -f
# 查看应用日志
tail -f ~/.ollama/logs/server.log
# Windows 日志
Get-Content $env:APPDATA\ollama\logs\server.log -Tail 50 -Wait
网络诊断
# 检查服务是否运行
curl http://localhost:11434/api/version
# 检查端口占用
netstat -an | grep 11434
# Windows
netstat -an | findstr 11434
这些命令涵盖了 Ollama 的主要功能。建议先掌握 pull、run、list、rm 等基础命令,再逐步学习高级功能。
更多推荐



所有评论(0)