一键部署AI全栈：Docker+Ollama实战指南

ogh80slT5g

492人浏览 · 2025-10-10 01:31:52

ogh80slT5g · 2025-10-10 01:31:52 发布

环境准备

确保服务器已安装Docker和Docker Compose。Ollama作为大模型服务需单独安装，可通过官方脚本快速部署：

curl -fsSL https://ollama.com/install.sh | sh

前端部署配置

创建前端Docker镜像时，需基于Node环境构建静态文件。示例Dockerfile：

FROM node:18 as builder
WORKDIR /app
COPY package*.json ./
RUN npm install
COPY . .
RUN npm run build

FROM nginx:alpine
COPY --from=builder /app/dist /usr/share/nginx/html
COPY nginx.conf /etc/nginx/conf.d/default.conf

对应的Nginx配置需处理跨域和路由重定向：

server {
    listen 80;
    location / {
        root /usr/share/nginx/html;
        try_files $uri $uri/ /index.html;
    }
    location /api {
        proxy_pass http://backend:8000;
    }
    location /ollama {
        proxy_pass http://ollama:11434;
    }
}

后端服务部署

后端Dockerfile需包含Python环境和依赖安装：

FROM python:3.9-slim
WORKDIR /app
COPY requirements.txt .
RUN pip install -r requirements.txt
COPY . .
CMD ["gunicorn", "--bind", "0.0.0.0:8000", "app.wsgi"]

容器编排配置

docker-compose.yml需整合所有服务：

version: '3.8'
services:
  frontend:
    build: ./frontend
    ports:
      - "80:80"
    depends_on:
      - backend
      - ollama

  backend:
    build: ./backend
    environment:
      - OLLAMA_HOST=ollama:11434
    ports:
      - "8000:8000"

  ollama:
    image: ollama/ollama
    ports:
      - "11434:11434"
    volumes:
      - ollama_data:/root/.ollama

volumes:
  ollama_data:

部署与验证

构建并启动容器：

docker-compose up -d --build

验证Ollama服务连通性：

curl http://localhost:11434/api/tags

前端访问测试应自动重定向到index.html，后端API请求需通过/api路径代理。

注意事项

Ollama首次运行会自动下载模型文件，确保服务器磁盘空间充足
生产环境建议配置HTTPS，可通过Let's Encrypt生成证书
静态文件建议启用Nginx的gzip压缩和缓存控制
高并发场景需调整Gunicorn的worker数量：

# gunicorn_config.py
workers = 4
threads = 2

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

25.TCO 成本测算：训练与推理的完整成本模型

AI编程社区

ChatGPT帮我写SECS/GEM通信代码：一个MES工程师的AI提效实战

AI编程社区

AI Agent Harness Engineering 的“黑箱”拆解：使用 LangSmith 进行全链路追踪与可视化

核心概念：AI Agent Harness Engineering（，下文简称）是 2023-2024 年大语言模型（LLM）、多模态模型（MMM）技术落地企业级复杂任务时的核心分支之一——它不再满足于让单个 LLM 执行简单的问答、文本生成，而是设计、开发、调试、部署、监控、迭代。问题背景：2022 年底 ChatGPT 的发布让“LLM 通用智能”的想象空间爆发，但当开发者和企业尝试将其应用到