问题： Error: embedding models require input text. Usage: ollama run qwen3-embedding:4b “your text

mqiqe

412人浏览 · 2026-03-04 17:16:46

mqiqe · 2026-03-04 17:16:46 发布

问题

Error: embedding models require input text.
Usage: ollama run qwen3-embedding:4b "your text here"

✅ 原因

qwen3-embedding:4b 是一个嵌入（embedding）模型，它的作用是将文本转换为向量（vector），不能像聊天模型那样直接“运行”进入交互模式。
Ollama 的 ollama run 命令对 embedding 模型有特殊要求：必须在命令行中直接提供要编码的文本。

✅ 正确用法

方法 1：直接传入文本（推荐用于测试）

ollama run qwen3-embedding:4b "今天天气真好"

输出会是一个浮点数向量（通常很长，比如 1024 或 4096 维）：

[0.123, -0.456, 0.789, ...]

⚠️ 注意：这个输出是纯文本格式的 JSON 数组，不是对话！

方法 2：在程序中调用（实际应用场景）
你不应该用 ollama run 在生产环境生成 embedding。正确做法是通过 Ollama API 调用：

curl http://localhost:11434/api/embeddings \
  -d '{
    "model": "qwen3-embedding:4b",
    "prompt": "今天天气真好"
  }'

返回示例：

{
  "embedding": [0.123, -0.456, ...]
}

在 Java / Python 等代码中，你应该调用这个 HTTP API，而不是执行 shell 命令。

❌ 错误用法（不要这样做）

# 错误！没有输入文本
ollama run qwen3-embedding:4b

# 错误！试图进入交互模式（embedding 模型不支持）
ollama run qwen3-embedding:4b
> 输入文本...

Embedding 模型是无状态、单次推理的工具，不像 qwen3:8b 那样支持多轮对话。

🔧 补充建议

确认模型是否拉取成功

ollama list

查看模型信息

ollama show qwen3-embedding:4b --modelfile

如果你需要聊天功能，请使用主模型

ollama run qwen3:8b    # 或 qwen3:4b

📌 总结

目的	命令
生成一段文本的 embedding	`ollama run qwen3-embedding:4b "你的文本"`
在代码中使用 embedding	调用 `POST /api/embeddings` API
进行对话/生成文本	使用 `qwen3:8b` 等生成式模型，而非 embedding 模型

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

Claude Code 前端UI设计进阶指南：从Emoji到专业图标，从渐变到真实背景

选对 Skill 是第一步：根据项目需求选择合适的 UI 设计 Skill，frontend-design 是基础，frontend-design-pro 和 impeccable 能带来质的飞跃图标专业化：放弃 Emoji，使用 Font Awesome、Lucide、Material Icons 等专业图标库，通过 CDN 方便引入背景真实化：用 Unsplash、Pexels 等正版图库的真

AI编程社区

使用 NumPy 和 Matplotlib 实现交互式数据可视化

本文介绍了如何利用NumPy和Matplotlib创建交互式数据可视化应用。首先概述了数据可视化的重要性及Python生态系统的相关工具，重点讲解了Matplotlib实现交互式功能的多种方式。文章详细指导了环境配置、交互式设计原则、NumPy基础操作以及Matplotlib基础绘图方法，并深入探讨了多种交互技术，包括ipywidgets、内置控件、事件处理、mplcursors标注工具以及动画与

AI编程社区

2026企业大模型管理中心排行：五大平台实测对比

针对AI工具厂商、SaaS服务厂商等需多模型调用的场景，优先选择weytoken，全模型覆盖、统一API调用可大幅降低开发与管理成本；实测中某AI工具创业团队通过weytoken实现了GPT-4o与Claude的统一管控，账号管理成本降低60%。针对有私有部署需求的中大型企业，可选择weytoken或阿里云通义千问企业版，weytoken提供私有部署咨询与独立通道部署方案，阿里云提供一体化云服务整