[企业AI落地] 我用 Ollama + Hermes + Codex + Open WebUI 搭了一套多人可用的本地 Agent 底座

技术小甜甜

255人浏览 · 2026-06-11 18:40:33

技术小甜甜 · 2026-06-11 18:40:33 发布

很多 Agent 产品看起来已经很强，但真正放到日常工作里，差距往往不在“会不会回答”，而在“能不能进入真实环境”。能不能读本地项目，能不能跑脚本，能不能操作内部工具，能不能保留长期上下文，能不能让多人在一个统一入口里使用，这些问题决定了 Agent 是一个演示能力，还是一套真的可以持续使用的工作底座。

企业级AI落地实战专栏头图

这段时间我自己搭了一套组合：Ollama 负责本地模型，Hermes 负责 Agent 编排和工具调用，Codex 负责工程执行，Open WebUI 负责多人 Web 入口。用下来之后，我最大的感受是，这是我目前尝试到现在，最符合多项目同步推进习惯的一种 Agent 实践方式。它既有接近 ChatGPT 的连续对话体验，又能把自动追问、知识库、笔记、多会话和多用户入口这些配套能力放在同一个工作台里；前端用起来很舒服，后端又能连到本地系统和项目环境里真正做事。对我来说，这已经不是某个单点工具的体验升级，而是一种更理想、更高效的 Agent 工作方式。

现在很多在线 Agent 已经可以调用 MCP，也可以连接一些外部服务。它们适合查资料、生成内容、分析公开信息、调用云端 API。对个人轻量任务来说，这已经足够方便。但企业里的真实任务经常不在云端，而在本地机器、内网系统、私有仓库、历史脚本和各种半自动流程里。

比如你要让 Agent 检查一个内部项目，它不能只会聊天，还得能进入项目目录、读取配置、运行测试、看日志、修改文件、重新验证。再比如你要让它协助运营流程，它可能要读取本地数据库、分析历史记录、生成任务、更新状态、等待人工确认。在线 Agent 即使能调用 MCP，只要无法可靠进入这些本地和内网环境，能做的事情就会被明显限制。

这不是说在线 Agent 没价值，而是它更适合信息型和通用型任务。真正进入企业落地阶段以后，Agent 需要面对的是执行环境、权限边界、状态保存和流程闭环。这个时候，只靠一个在线聊天入口往往不够。

Codex 这类执行型 Agent 很强，尤其适合工程任务。它能读代码、改文件、跑命令、修 bug、补测试，也能围绕一个明确目标持续推进。对开发者来说，这类工具已经非常接近“能干活的同事”。

但如果把视角放到企业内部协作，它也有一个问题：它更像任务专家，而不是多人入口。你需要知道什么时候进入这个 CLI，需要把项目路径、任务背景、上下文边界组织好。它非常适合处理具体任务，却不天然解决“企业里不同人怎么低门槛使用同一套 Agent 能力”的问题。

一个企业内部的 Agent 体系，不能只服务会用命令行的人。产品、运营、数据、测试、管理者都可能需要发起任务。有人只是想问一个内部系统的状态，有人想让 Agent 生成一份日报，有人想让它跑一个脚本，有人想把一个复杂流程交给它持续推进。如果所有人都要切到 CLI，门槛就会很高。

Hermes 的价值在这里开始变得明显。它不只是一个问答界面，而是更像一个可以组织工具、记忆、技能和流程的 Agent 容器。它可以调用 terminal、浏览器、文件系统、定时任务，也可以通过 skills 把某类任务的操作习惯固化下来。更重要的是，它适合承载那些不是“一问一答”的复杂任务。

很多企业 AI 任务本质上不是一条 prompt，而是一组状态机。比如一个发布流程可能是：先检查题库，再生成草稿，再保存到远端，再等待人工确认，再正式发布，再回写状态，再做数据复盘。一个内部数据任务可能是：先读取源数据，再做清洗，再生成报告，再校验异常，再发给负责人确认。这类任务最怕的不是模型不会写文字，而是每一步状态没有被持续管理和验证。

Hermes 的 planning、memory、skills 和工具调用能力，适合把这种复杂流程变成可复用的执行路径。它可以记住偏好，可以在流程中验证结果，也可以把遇到的问题固化成下一次不会再犯的 practice。对企业内部 Agent 来说，这比一次回答得漂亮更重要。

不过，Hermes 通过 CLI 使用时，仍然偏操作者视角。你需要切到对应任务，需要知道当前会话和项目上下文在哪里。Gateway 接聊天软件以后，体验会进一步改善：你可以在手机上随时发任务，可以在聊天软件里做审批和轻量协作，也可以把机器人放到项目群里。

但聊天软件也不是最终形态。如果以机器人为单位，项目切换还是不自然；如果以群来划分项目，很多时候还要 @ 机器人；如果企业里有多个项目、多个团队、多个会话，聊天软件更像一个通知和轻量交互入口，不太像一个长期工作的 AI 工作台。

Open WebUI 补上的正是这个入口问题。它的界面更接近 ChatGPT，普通用户学习成本很低。一个用户可以进入某个会话，围绕一个项目连续追问；每次回答后还会有自动提示，方便继续深入；多个会话、多个用户、多个模型也更适合在 Web 端集中管理。

把 Hermes 接到 Open WebUI 后，前端负责“让人容易用”，后端负责“让 Agent 能做事”。用户看到的是一个熟悉的聊天工作台，背后却可以是本地模型、本地项目、本地工具和复杂流程。这个组合的重点不是 Open WebUI 替代 Hermes，也不是 Hermes 替代 Codex，而是每一层各自负责自己的事情。

这套组合可以简单拆成四层。

Ollama 负责本地模型和私有推理能力。它让企业可以先在内网或本机环境里跑模型，不必所有请求都交给公网服务。对于一些涉及内部资料、代码、运维记录和客户信息的场景，这一点很重要。

Codex 负责工程执行。它适合面对代码仓库、脚本、测试、构建和修复任务。当一个任务需要读写项目、跑命令、定位错误时，Codex 这种执行能力比普通聊天模型更接近真正的生产工具。

Hermes 负责 Agent 编排。它把模型、终端、浏览器、文件、记忆、skills、计划和验证步骤组织起来，让任务不只是一次生成，而是可以持续推进。它也适合把某个团队的工作流固化下来，比如内容运营、内部报表、数据检查、项目巡检、自动化发布等。

Open WebUI 负责多人入口。它让这套能力不再只属于会用 CLI 的人，而是可以通过 Web 页面提供给更多角色使用。不同用户可以进入自己的会话，企业也可以逐步把模型、项目和权限入口收拢到一个更统一的界面里。

如果放到企业内部，这种架构的想象空间很大。

第一类场景是内部知识和项目问答。Open WebUI 提供统一入口，后端可以接本地模型、内部文档、项目资料和工具能力。员工不用知道模型部署在哪里，也不用理解每个工具怎么调用，只需要在 Web 里问问题。真正敏感的数据则可以尽量留在内网或本地环境中处理。

第二类场景是工程自动化。开发、测试、运维人员可以在 WebUI 里发起任务，Hermes 根据流程调用本地脚本、Codex、测试命令或内部接口。它不是只给一段建议，而是可以真的检查项目、生成改动、跑验证，再把结果返回给人。

第三类场景是运营和数据流程。很多运营任务并不难，但步骤多、状态多、容易漏。比如每天检查数据、生成报告、同步任务、更新台账、复盘异常。把这些流程交给带工具能力的 Agent 后，人负责判断和确认，Agent 负责执行和记录，会比单纯让 AI 写一段文案更有价值。

第四类场景是多用户协作。企业内部不是一个人在用 AI，而是一组人围绕不同项目使用 AI。如果每个人都单独配置模型、CLI、脚本和密钥，维护成本会很高。Open WebUI 这类入口可以把多人使用体验先统一起来，再由后端的 Hermes 和本地工具体系承接真正的执行任务。

这里有一个很关键的分界：企业 Agent 不应该只被理解成“一个会聊天的模型”。更准确地说，它应该是一套能连接入口、模型、工具、数据、权限和状态的工作系统。模型能力当然重要，但如果入口不好用、工具连不上、状态保不住、结果不可验证，企业很难把它放进真实流程里。

我现在这套组合还不是一个最终形态，也不是说所有企业都应该照搬。它更像一个清晰的方向：前端用 Open WebUI 降低使用门槛，后端用 Hermes 组织流程和工具，用 Codex 处理工程执行，用 Ollama 提供本地模型能力。这样拼起来以后，Agent 不再只是一个聊天框，而是能逐步变成企业内部的执行底座。

这篇先只讲体验和架构判断。具体怎么把 Ollama、Hermes、Codex 和 Open WebUI 安装起来，怎么把它整理成一套可复用的本地环境，以及人在外面时如何远程访问家里的 Open WebUI Agent 系统，都可以单独展开。因为这两件事一旦讲细，就已经不是体验分享，而是完整的搭建方案和远程访问方案。

对企业来说，真正值得关注的不是某个 Agent 工具今天又多了一个功能，而是它能不能进入真实工作环境，能不能被多人低门槛使用，能不能连接本地工具和内部流程，能不能把一次回答变成可持续推进的任务闭环。Ollama、Hermes、Codex 和 Open WebUI 组合起来，刚好把这几个层次放到了一起。它不一定是唯一解，但它说明了一件事：企业 Agent 的落地重点，正在从“模型会不会回答”转向“系统能不能执行”。

实际使用时，Open WebUI 会把这套 Agent 能力包装成普通人熟悉的 Web 入口。下面是本机服务启动后的真实入口页面，后续多用户、项目会话和外部连接配置都可以从这个入口继续展开。

Open WebUI 登录入口截图