OrgAgent:像公司一样组织你的多智能体系统
摘要
虽然基于大语言模型的多智能体系统在复杂推理方面展现出强大潜力,但如何有效组织多个智能体仍是一个未解的问题。本文提出了OrgAgent——一种公司式层级多智能体框架,将协作划分为治理层、执行层和合规层。

OrgAgent将多智能体推理分解为三个层级:治理层负责规划与资源分配,执行层负责任务求解与审查,合规层负责最终答案的控制。通过在推理任务、大语言模型、执行模式和执行策略等多个维度上对该框架进行评估,我们发现采用公司式层级组织的多智能体系统通常优于其他组织结构。此外,在大多数设定下,层级化协作相较于扁平化协作还能降低令牌消耗。

例如,在SQuAD 2.0数据集上,GPT-OSS-120B模型在层级化设定下的性能比扁平化多智能体系统提升了102.73%,同时令牌使用量减少了74.52%。进一步分析表明,当任务能够从稳定的技能分配、受控的信息流和分层验证中获益时,层级结构的作用最为显著。总体而言,我们的研究结果凸显了组织结构作为多智能体推理中一个重要因素的价值,它不仅影响效能和成本,也影响协作行为。
1 引言

大语言模型已从单轮对话助手演变为具备规划、工具使用和协作能力的日益自主的智能体。这些进展推动了基于大语言模型的多智能体系统的发展,该系统在问题求解、软件工程和仿真等复杂场景中得到了越来越多的研究(Guo 等,2024;Li 等,2024;He 等,2025)。现有研究沿着两个方向展开。一条方向研究智能体之间的交互机制,聚焦于智能体如何通过角色扮演、讨论、辩论、投票或共识等方式进行通信与协作,以CAMEL(Li 等,2023)为代表。另一条方向则关注更高层级的组织,强调角色分配、工作流设计和系统级协调,以AutoGen(Wu 等,2024)等框架以及MetaGPT(Hong 等,2023)、ChatDev(Qian 等,2024)和Paperclip(paperclipai,2026)等角色专业化协作系统为代表。

组织多智能体系统的一种自然方式是通过组织结构(Pugh,1971;Mintzberg,1979;Daft,2007)。在组织理论中,组织结构决定了任务、协调、监督和决策权如何分配,从而塑造组织行为(Burton 等,2012)。常见的形式包括管理层级较少的扁平结构(Ghiselli 和 Siegel,1972)和管理层级更为复杂的层级结构(Child,2019)。其中,公司式层级经过数十年的演变,已形成了完善的目标对齐、角色划分、资源分配和结果验证机制(Mintzberg,1979;Burton 等,2012)。这使得公司式层级成为组织多智能体系统的自然基础,因为它明确定义了谁负责规划、谁负责执行、谁负责审查以及决策如何被控制。

在本工作中,如图1所示,我们将组织结构实例化为公司式层级——这是现实世界中最常见的组织结构之一——以研究结构化治理如何影响多智能体推理。OrgAgent将推理过程分解为三个层级:1)治理层,负责规划、路由和资源分配;2)执行层,负责答案生成、批判和修订,其交互过程进一步通过不同的执行模式和执行策略进行控制;3)合规层,负责最终答案验证和输出控制。随后,我们在三个推理基准测试(MuSR、MuSiQue 和 SQuAD 2.0)上,使用三种语言模型以及多种执行模式和执行策略对该框架进行了评估。结果表明,以公司式层级组织的多智能体系统总体上优于扁平化多智能体基线以及单智能体基线,尤其在 MuSiQue 和 SQuAD 2.0 上表现更为突出。
更多推荐


所有评论(0)