Ollama 简介

晚夜微雨问海棠呀

178人浏览 · 2026-05-14 18:39:34

晚夜微雨问海棠呀 · 2026-05-14 18:39:34 发布

Ollama 简介

Ollama 是一个开源的本地大语言模型运行框架，旨在简化大模型在本地环境的部署和使用。

核心特点

本地运行：模型完全在本地机器上执行，数据不出本机，保障隐私安全
简单易用：一条命令即可下载并运行模型，无需复杂配置
模型丰富：支持 Llama、Gemma、Mistral、Qwen、DeepSeek 等主流开源模型
轻量高效：针对消费级硬件优化，普通电脑即可运行

基本用法

# 安装后运行模型（自动下载）
ollama run llama3

# 拉取模型
ollama pull qwen2

# 查看已下载模型
ollama list

# 删除模型
ollama rm llama3

API 接口

Ollama 启动后默认在 http://localhost:11434 提供 REST API，兼容 OpenAI API 格式：

# 生成补全
curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "Hello"
}'

# 对话补全
curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [{"role": "user", "content": "Hello"}]
}'

也可通过 SDK 集成：

// Node.js
import { Ollama } from 'ollama';
const ollama = new Ollama();
const response = await ollama.chat({
  model: 'llama3',
  messages: [{ role: 'user', content: 'Hello' }],
});

# Python
import ollama
response = ollama.chat(
    model='llama3',
    messages=[{'role': 'user', 'content': 'Hello'}],
)

Modelfile 自定义

Ollama 支持通过 Modelfile 创建自定义模型，类似 Dockerfile：

FROM llama3
PARAMETER temperature 0.7
SYSTEM You are a helpful coding assistant.

ollama create my-model -f Modelfile

适用场景

场景	说明
隐私敏感应用	数据不离开本地
离线环境	无需网络即可使用
开发测试	快速验证模型效果
成本控制	无 API 调用费用
RAG 应用	结合本地知识库构建问答系统

支持平台

macOS
Linux
Windows

Ollama 降低了使用大语言模型的门槛，让开发者和用户无需依赖云端服务，即可在本地体验和集成大模型能力。

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

大模型评测与AI产品质量保障：第4篇主流大模型全景图比较

AI编程社区

大模型核心技术与企业级应用实战指南-附录

这篇文章摘要如下：《附录：AI术语速查手册》整理了人工智能领域的核心概念和工具，涵盖从基础算法到前沿技术的150+个关键术语。内容按字母顺序编排，包含术语定义、技术原理和典型应用场景，如Transformer架构、注意力机制、RAG系统等。手册特别标注了ChatGPT、BERT等主流模型的技术特点，以及LoRA微调、思维链提示等实用技巧，同时解释困惑度、BLEU等评估指标。作为工具性附录，它既可