Google研究发现MultiAgent的核心竟然是Prompt设计

shadowrocket • 2026年1月25日 pm8:10 • 小火箭, 小火箭下载, 小火箭节点, 科学上网

论文地址：https://arxiv.org/pdf/2502.02533

论文名称：Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

为了自动化整个设计过程， Google & 剑桥大学首先对设计空间进行了深入分析，旨在了解构建有效MAS的因素。发现：提示设计对下游性能有显著影响，而有效的拓扑结构只占整个搜索空间的一小部分。

在数学问题上，Gemini 1.5 Pro 对比仅使用自我一致性（SC）、自我细化（reflect）和多智能体辩论（debate）进行扩展的智能体，展示了每个问题的提示优化智能体的准确率与总标记数的关系。误差条表示1个标准差。我们表明，通过更有效的提示，利用更多的计算资源可以获得更高的准确率。

使用 Gemini 1.5 Pro 的不同拓扑结构的性能与基础智能体相比，每个拓扑结构都通过 APO 进行了优化，其中“Sum.”（总结）和“Exe.”（执行器）是如图4所示的任务特定拓扑结构。我们观察到，并非所有拓扑结构都对多智能体系统（MAS）设计有积极影响。

基于这些发现，Google&剑桥大学提出了 Mass框架，该框架通过三个阶段优化MAS：

块级（局部）提示优化：对每个拓扑块中的智能体进行提示优化。

工作流拓扑优化：在修剪过的拓扑空间中优化工作流拓扑结构。

工作流级（全局）提示优化：在找到的最佳拓扑结构上进行全局提示优化。

提出的多智能体系统搜索（Mass）框架通过在可定制的多智能体设计空间中交错进行提示优化和拓扑优化，发现了有效的多智能体系统设计（右侧为经过优化的拓扑结构和优化的提示），关键组件如左侧所示

实验使用了Gemini 1.5 Pro和Flash模型，并与多种现有方法进行了比较，包括链式思考（CoT）、自我一致性（SC）、自我细化（Self-Refine）、多智能体辩论（Multi-Agent Debate）、ADAS和AFlow。

性能提升：Mass在多个任务上显著优于现有方法，平均性能提升约10%以上。

优化阶段的重要性：通过分阶段优化，Mass在每个阶段都取得了性能提升，证明了从局部到全局优化的必要性。

提示和拓扑结构的协同优化：Mass通过同时优化提示和拓扑结构，实现了比单独优化更好的性能。

成本效益：Mass在优化过程中表现出稳定且有效的性能提升，与现有自动设计方法相比，具有更高的样本效率和成本效益。

THE END

二维码

狂飙3000star最火大模型教程组队学习来了

影响全球程序员黄仁勋编程语言的未来是Human

下一篇>>

搜索内容