ollama v0.6.4 预发布版本震撼发布！Gemma 3 性能大升级，内存泄漏终修复！

福大大架构师每日一题 · 2025-04-04 06:59:33 发布

在这里插入图片描述

Ollama 作为当前最热门的本地大模型运行框架，近日推出了 v0.6.4 预发布版本，带来了一系列关键修复和优化！本次更新重点改进了 Gemma 3 的性能表现，并修复了多个影响体验的 Bug，AI 玩家们赶紧来一睹为快！

🔍 /api/show 新增模型能力显示（如视觉支持）
- 现在通过 /api/show 接口可以查看模型的完整能力，包括是否支持多模态（如图像识别），方便开发者更灵活地调用模型功能。
💾 Gemma 3 内存泄漏问题修复
- 此前 Gemma 3 在长时间推理时可能出现 OOM（内存不足）崩溃，v0.6.4 优化了内存管理，运行更稳定！
🌍 Gemma 3 多语言字符处理增强
- 修复了 Gemma 3 对**非英文字符（如中文、日文）**的识别和生成问题，输出质量更高！
🔄 DeepSeek 架构上下文偏移问题修复
- 部分采用 DeepSeek 架构的模型（如 DeepSeek LLM）在长文本生成时可能出现**“上下文错乱”**，本次更新彻底解决！
📜 Gemma 3 长文本输出优化（512/1024 tokens 后质量下降修复）
- 在 v0.6.3 中，Gemma 3 生成超过 512 或 1024 tokens 后，回答质量会明显下降，新版本已修复该问题，长文生成更流畅！
🖥️ Linux 平台新增 RDNA4 显卡支持（AMD 用户狂喜！）
- 现在 RDNA4 架构显卡（如 RX 7000 系列） 在 Linux 上也能更好地运行 Ollama！