Ollama 简介

Ollama 是一个开源的本地大语言模型运行框架,旨在简化大模型在本地环境的部署和使用。

核心特点

  • 本地运行:模型完全在本地机器上执行,数据不出本机,保障隐私安全
  • 简单易用:一条命令即可下载并运行模型,无需复杂配置
  • 模型丰富:支持 Llama、Gemma、Mistral、Qwen、DeepSeek 等主流开源模型
  • 轻量高效:针对消费级硬件优化,普通电脑即可运行

基本用法

# 安装后运行模型(自动下载)
ollama run llama3

# 拉取模型
ollama pull qwen2

# 查看已下载模型
ollama list

# 删除模型
ollama rm llama3

API 接口

Ollama 启动后默认在 http://localhost:11434 提供 REST API,兼容 OpenAI API 格式:

# 生成补全
curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "Hello"
}'

# 对话补全
curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [{"role": "user", "content": "Hello"}]
}'

也可通过 SDK 集成:

// Node.js
import { Ollama } from 'ollama';
const ollama = new Ollama();
const response = await ollama.chat({
  model: 'llama3',
  messages: [{ role: 'user', content: 'Hello' }],
});
# Python
import ollama
response = ollama.chat(
    model='llama3',
    messages=[{'role': 'user', 'content': 'Hello'}],
)

Modelfile 自定义

Ollama 支持通过 Modelfile 创建自定义模型,类似 Dockerfile:

FROM llama3
PARAMETER temperature 0.7
SYSTEM You are a helpful coding assistant.
ollama create my-model -f Modelfile

适用场景

场景 说明
隐私敏感应用 数据不离开本地
离线环境 无需网络即可使用
开发测试 快速验证模型效果
成本控制 无 API 调用费用
RAG 应用 结合本地知识库构建问答系统

支持平台

  • macOS
  • Linux
  • Windows

Ollama 降低了使用大语言模型的门槛,让开发者和用户无需依赖云端服务,即可在本地体验和集成大模型能力。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐