很多 Agent 产品看起来已经很强,但真正放到日常工作里,差距往往不在“会不会回答”,而在“能不能进入真实环境”。能不能读本地项目,能不能跑脚本,能不能操作内部工具,能不能保留长期上下文,能不能让多人在一个统一入口里使用,这些问题决定了 Agent 是一个演示能力,还是一套真的可以持续使用的工作底座。

企业级AI落地实战专栏头图

这段时间我自己搭了一套组合:Ollama 负责本地模型,Hermes 负责 Agent 编排和工具调用,Codex 负责工程执行,Open WebUI 负责多人 Web 入口。用下来之后,我最大的感受是,这是我目前尝试到现在,最符合多项目同步推进习惯的一种 Agent 实践方式。它既有接近 ChatGPT 的连续对话体验,又能把自动追问、知识库、笔记、多会话和多用户入口这些配套能力放在同一个工作台里;前端用起来很舒服,后端又能连到本地系统和项目环境里真正做事。对我来说,这已经不是某个单点工具的体验升级,而是一种更理想、更高效的 Agent 工作方式。

现在很多在线 Agent 已经可以调用 MCP,也可以连接一些外部服务。它们适合查资料、生成内容、分析公开信息、调用云端 API。对个人轻量任务来说,这已经足够方便。但企业里的真实任务经常不在云端,而在本地机器、内网系统、私有仓库、历史脚本和各种半自动流程里。

比如你要让 Agent 检查一个内部项目,它不能只会聊天,还得能进入项目目录、读取配置、运行测试、看日志、修改文件、重新验证。再比如你要让它协助运营流程,它可能要读取本地数据库、分析历史记录、生成任务、更新状态、等待人工确认。在线 Agent 即使能调用 MCP,只要无法可靠进入这些本地和内网环境,能做的事情就会被明显限制。

这不是说在线 Agent 没价值,而是它更适合信息型和通用型任务。真正进入企业落地阶段以后,Agent 需要面对的是执行环境、权限边界、状态保存和流程闭环。这个时候,只靠一个在线聊天入口往往不够。

Codex 这类执行型 Agent 很强,尤其适合工程任务。它能读代码、改文件、跑命令、修 bug、补测试,也能围绕一个明确目标持续推进。对开发者来说,这类工具已经非常接近“能干活的同事”。

但如果把视角放到企业内部协作,它也有一个问题:它更像任务专家,而不是多人入口。你需要知道什么时候进入这个 CLI,需要把项目路径、任务背景、上下文边界组织好。它非常适合处理具体任务,却不天然解决“企业里不同人怎么低门槛使用同一套 Agent 能力”的问题。

一个企业内部的 Agent 体系,不能只服务会用命令行的人。产品、运营、数据、测试、管理者都可能需要发起任务。有人只是想问一个内部系统的状态,有人想让 Agent 生成一份日报,有人想让它跑一个脚本,有人想把一个复杂流程交给它持续推进。如果所有人都要切到 CLI,门槛就会很高。

Hermes 的价值在这里开始变得明显。它不只是一个问答界面,而是更像一个可以组织工具、记忆、技能和流程的 Agent 容器。它可以调用 terminal、浏览器、文件系统、定时任务,也可以通过 skills 把某类任务的操作习惯固化下来。更重要的是,它适合承载那些不是“一问一答”的复杂任务。

很多企业 AI 任务本质上不是一条 prompt,而是一组状态机。比如一个发布流程可能是:先检查题库,再生成草稿,再保存到远端,再等待人工确认,再正式发布,再回写状态,再做数据复盘。一个内部数据任务可能是:先读取源数据,再做清洗,再生成报告,再校验异常,再发给负责人确认。这类任务最怕的不是模型不会写文字,而是每一步状态没有被持续管理和验证。

Hermes 的 planning、memory、skills 和工具调用能力,适合把这种复杂流程变成可复用的执行路径。它可以记住偏好,可以在流程中验证结果,也可以把遇到的问题固化成下一次不会再犯的 practice。对企业内部 Agent 来说,这比一次回答得漂亮更重要。

不过,Hermes 通过 CLI 使用时,仍然偏操作者视角。你需要切到对应任务,需要知道当前会话和项目上下文在哪里。Gateway 接聊天软件以后,体验会进一步改善:你可以在手机上随时发任务,可以在聊天软件里做审批和轻量协作,也可以把机器人放到项目群里。

但聊天软件也不是最终形态。如果以机器人为单位,项目切换还是不自然;如果以群来划分项目,很多时候还要 @ 机器人;如果企业里有多个项目、多个团队、多个会话,聊天软件更像一个通知和轻量交互入口,不太像一个长期工作的 AI 工作台。

Open WebUI 补上的正是这个入口问题。它的界面更接近 ChatGPT,普通用户学习成本很低。一个用户可以进入某个会话,围绕一个项目连续追问;每次回答后还会有自动提示,方便继续深入;多个会话、多个用户、多个模型也更适合在 Web 端集中管理。

把 Hermes 接到 Open WebUI 后,前端负责“让人容易用”,后端负责“让 Agent 能做事”。用户看到的是一个熟悉的聊天工作台,背后却可以是本地模型、本地项目、本地工具和复杂流程。这个组合的重点不是 Open WebUI 替代 Hermes,也不是 Hermes 替代 Codex,而是每一层各自负责自己的事情。

这套组合可以简单拆成四层。

Ollama 负责本地模型和私有推理能力。它让企业可以先在内网或本机环境里跑模型,不必所有请求都交给公网服务。对于一些涉及内部资料、代码、运维记录和客户信息的场景,这一点很重要。

Codex 负责工程执行。它适合面对代码仓库、脚本、测试、构建和修复任务。当一个任务需要读写项目、跑命令、定位错误时,Codex 这种执行能力比普通聊天模型更接近真正的生产工具。

Hermes 负责 Agent 编排。它把模型、终端、浏览器、文件、记忆、skills、计划和验证步骤组织起来,让任务不只是一次生成,而是可以持续推进。它也适合把某个团队的工作流固化下来,比如内容运营、内部报表、数据检查、项目巡检、自动化发布等。

Open WebUI 负责多人入口。它让这套能力不再只属于会用 CLI 的人,而是可以通过 Web 页面提供给更多角色使用。不同用户可以进入自己的会话,企业也可以逐步把模型、项目和权限入口收拢到一个更统一的界面里。

如果放到企业内部,这种架构的想象空间很大。

第一类场景是内部知识和项目问答。Open WebUI 提供统一入口,后端可以接本地模型、内部文档、项目资料和工具能力。员工不用知道模型部署在哪里,也不用理解每个工具怎么调用,只需要在 Web 里问问题。真正敏感的数据则可以尽量留在内网或本地环境中处理。

第二类场景是工程自动化。开发、测试、运维人员可以在 WebUI 里发起任务,Hermes 根据流程调用本地脚本、Codex、测试命令或内部接口。它不是只给一段建议,而是可以真的检查项目、生成改动、跑验证,再把结果返回给人。

第三类场景是运营和数据流程。很多运营任务并不难,但步骤多、状态多、容易漏。比如每天检查数据、生成报告、同步任务、更新台账、复盘异常。把这些流程交给带工具能力的 Agent 后,人负责判断和确认,Agent 负责执行和记录,会比单纯让 AI 写一段文案更有价值。

第四类场景是多用户协作。企业内部不是一个人在用 AI,而是一组人围绕不同项目使用 AI。如果每个人都单独配置模型、CLI、脚本和密钥,维护成本会很高。Open WebUI 这类入口可以把多人使用体验先统一起来,再由后端的 Hermes 和本地工具体系承接真正的执行任务。

这里有一个很关键的分界:企业 Agent 不应该只被理解成“一个会聊天的模型”。更准确地说,它应该是一套能连接入口、模型、工具、数据、权限和状态的工作系统。模型能力当然重要,但如果入口不好用、工具连不上、状态保不住、结果不可验证,企业很难把它放进真实流程里。

我现在这套组合还不是一个最终形态,也不是说所有企业都应该照搬。它更像一个清晰的方向:前端用 Open WebUI 降低使用门槛,后端用 Hermes 组织流程和工具,用 Codex 处理工程执行,用 Ollama 提供本地模型能力。这样拼起来以后,Agent 不再只是一个聊天框,而是能逐步变成企业内部的执行底座。

这篇先只讲体验和架构判断。具体怎么把 Ollama、Hermes、Codex 和 Open WebUI 安装起来,怎么把它整理成一套可复用的本地环境,以及人在外面时如何远程访问家里的 Open WebUI Agent 系统,都可以单独展开。因为这两件事一旦讲细,就已经不是体验分享,而是完整的搭建方案和远程访问方案。

对企业来说,真正值得关注的不是某个 Agent 工具今天又多了一个功能,而是它能不能进入真实工作环境,能不能被多人低门槛使用,能不能连接本地工具和内部流程,能不能把一次回答变成可持续推进的任务闭环。Ollama、Hermes、Codex 和 Open WebUI 组合起来,刚好把这几个层次放到了一起。它不一定是唯一解,但它说明了一件事:企业 Agent 的落地重点,正在从“模型会不会回答”转向“系统能不能执行”。

实际使用时,Open WebUI 会把这套 Agent 能力包装成普通人熟悉的 Web 入口。下面是本机服务启动后的真实入口页面,后续多用户、项目会话和外部连接配置都可以从这个入口继续展开。

Open WebUI 登录入口截图

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐