当目标可能不一致或信息不完整的自主智能体必须合作时,仅仅交换数据是不够的。它们需要机制来调和分歧,做出共同决策,并承诺采取协调行动。这正是协商和共识形成方法变得不可或缺的地方。协商让智能体能够迭代地调整提议,以就行动方案或资源分配达成双方都能接受的协议。另一方面,共识机制帮助一组智能体从多个选项中达成共同的理解、信念或选择。在多智能体大型语言模型系统中,这些过程可以利用大型语言模型先进的语言理解和生成能力,与通常依赖高度结构化、符号化通信的传统智能体系统相比,能够实现更灵活、更像人类的互动。任务与资源分配的协商协议协商是多智能体系统中的一个基本过程,它使得智能体能够解决利益冲突并找到共同点。它通常涉及一系列提议和反提议,直到达成协议或协商失败。合同网络协议 (CNP)合同网络协议 (CNP) 是一个在分布式系统中用于任务分配的成熟去中心化协议。它模仿人类的合同机制。该过程通常包括以下阶段:任务发布: 一个智能体(“管理者”或“发起者”)确定它无法自行执行的任务,并向其他智能体广播任务发布或“提案征集”。此发布详细说明任务规范、约束(例如,截止日期、质量要求)以及任何奖励。大型语言模型在生成详细而清晰的自然语言任务描述方面可以发挥重要作用。投标: 收到发布的智能体(潜在的“承包商”)根据自身能力、当前工作量和资源评估任务。如果一个智能体愿意并能够执行该任务,它会向管理者提交“投标”。一个基于大型语言模型的承包商智能体可以利用其推理能力来评估其对任务的适合性,并制定有竞争力的投标,其中可能概述其方法或预期质量。授予: 管理者智能体在规定期限内收集投标。然后,它根据预定义标准(例如,价格、预计时间、承包商声誉)评估这些投标。管理者选择一个或多个成功的承包商并授予它们合同。大型语言模型可以协助管理者比较投标,特别是当投标包含定性文本信息或复杂的权衡时。执行与报告: 被授予合同的承包商执行任务,并向管理者报告结果或成果。digraph ContractNetProtocol { rankdir=TB; node [shape=box, style="rounded,filled", fontname="sans-serif", fontsize=10]; edge [fontname="sans-serif", fontsize=9, color="#495057"]; graph [fontname="sans-serif", fontsize=10]; Manager [label="管理者智能体\n(任务发布)", fillcolor="#74c0fc", fontcolor="#FFFFFF"]; Contractor1 [label="承包商智能体 A\n(评估任务)", fillcolor="#a5d8ff"]; Contractor2 [label="承包商智能体 B\n(评估任务)", fillcolor="#a5d8ff"]; Contractor3 [label="承包商智能体 C\n(评估任务)", fillcolor="#a5d8ff"]; Manager -> {Contractor1, Contractor2, Contractor3} [label="1. 招标 (任务规格)", color="#228be6"]; Contractor1 -> Manager [label="2a. 提交投标 A", style=dashed, color="#15aabf"]; Contractor2 -> Manager [label="2b. 提交投标 B", style=dashed, color="#15aabf"]; Contractor3 -> Manager [label="2c. 拒绝投标", style=dashed, color="#f03e3e"]; Manager -> Contractor2 [label="3. 授予合同 (给 B)", color="#37b24d", penwidth=2]; Contractor2 -> Manager [label="4. 确认并报告结果", style=dashed, color="#37b24d"]; }合同网络协议中的消息流。管理者发布任务,承包商投标,管理者将合同授予最合适的投标者。CNP 的优点:去中心化: 任务分配决策可由智能体在本地做出。灵活性: 智能体可以加入或离开网络,协议也可以适应。负载均衡: 任务会自然地分配给具有可用能力的智能体。CNP 的局限性:通信开销: 可能涉及大量消息。无法保证授予: 如果未收到合适的投标,任务可能不会被授予。投标评估复杂性: 评估投标可能很复杂,尤其是在有许多标准的情况下。大型语言模型可以通过生成丰富的任务描述、解释可能包含理由或替代建议的投标,甚至使用自然语言进行投标前澄清来增强合同网络协议。基于拍卖的机制拍卖是分配资源或任务的另一种常见的协议系列,特别是在存在明确竞争时。存在各种拍卖类型,每种都有不同的特点:英式拍卖 (升价): 竞标者相继提高出价;出价最高者获胜并支付其出价。荷式拍卖 (降价): 拍卖师从高价开始,逐渐降低,直到有竞标者接受当前价格。密封投标第一价格拍卖: 每位竞标者提交一份密封投标;出价最高者获胜并支付其出价。维克里拍卖 (密封投标第二价格拍卖): 每位竞标者提交一份密封投标;出价最高者获胜,但支付的是第二高出价的价格。这种拍卖类型鼓励如实出价。在多智能体大型语言模型系统中,一个大型语言模型智能体可以充当拍卖师,管理拍卖过程并传达价格变化或投标状态。其他大型语言模型智能体可以是竞标者,采用策略以有利条件赢得物品。大型语言模型对价值、风险和对手行为(如果可观察或可推断)进行推理的能力,可以为其投标策略提供信息。可以设计提示来引导大型语言模型智能体的投标行为,例如设定最高支付意愿或采取保守或激进的立场。例如,考虑一个情景,多个数据分析智能体需要访问具有有限并发访问槽位的高级金融数据API。可以定期举行拍卖来分配这些槽位。代表高优先级分析任务的大型语言模型智能体可能会被提示比处理低优先级任务的智能体更积极地出价。拍卖机制的注意事项:真实性: 某些拍卖类型(如维克里拍卖)会激励如实披露估价,而其他类型可能导致战略性低估/高估出价。复杂性: 设计和实施复杂的拍卖可能具有挑战性。串通: 智能体可能会串通以操纵拍卖结果,这是系统设计中需要考量的风险。共识建立策略共识是指一组智能体达成共同认可的决定或共享信念状态的过程。当没有单一“正确”答案,或需要集体协议以进行协调行动时,这很重要。投票系统投票是一种汇总个体偏好以达成集体决定的直接方法。可以采用多种投票方案:相对多数投票: 每个智能体为其首选选项投一票。得票最多的选项获胜,即使它没有获得多数票。绝对多数投票: 一个选项需要超过 50% 的选票才能获胜。如果初始没有选项获得多数票,可能需要进行决选。排序选择投票 (例如,波达计数、即时淘汰投票): 智能体根据偏好对选项进行排序。然后使用特定规则汇总这些排序以确定获胜者。这可以比简单的相对多数投票产生更详细的结果。大型语言模型智能体可以通过以下方式参与投票:评估选项: 利用其推理能力,根据给定标准或其编程目标评估不同的提议或选择。形成偏好: 确定其首选选项或选项排序。投票: 以结构化格式传达其投票或偏好排序。解释投票 (可选): 大型语言模型可以为其投票决定生成自然语言理由,从而增加透明度。例如,一个由基于大型语言模型的设计智能体组成的团队可能会投票决定采用几个提议的用户界面原型中的哪一个。每个智能体都可以根据可用性启发式、美学原则和项目要求评估原型,然后投出排序票。基于论证的共识论证为共识提供了一种更具审议性的方法。智能体就一组提议或信念交换论证和反论证。目标是根据辩证过程集体确定哪些主张是可接受或合理的。一个论证过程通常包括:提议/主张: 智能体提出主张或提议。论证: 智能体提供支持或攻击主张的理由(论证)。一个论证可能由一个主张以及支持它的证据或推理组成。评估: 智能体评估所有论证的集合,考虑它们之间的攻击或支持等关系。可接受性语义: 通常使用正式框架(例如,Dung 的抽象论证框架)来确定“获胜”或“可接受”的论证集合,并因此确定它们所支持的主张。大型语言模型特别适合进行论证,因为它们具有卓越的自然语言能力:生成论证: 大型语言模型可以构建有说服力的论证,利用其知识库和推理能力。理解论证: 它们可以解析和理解其他智能体提出的论证,识别主张、前提和逻辑结构。生成反论证: 大型语言模型可以识别对方论证中的弱点,并制定相关的反论证或反驳。识别一致/分歧点: 通过对话,大型语言模型可以帮助找出争议的核心问题和共识正在形成的地方。设想一个负责战略规划的多智能体系统。一个大型语言模型智能体可能提议策略 A,论证其潜在回报。另一个智能体可能通过指出其风险来攻击这一点,并提议策略 B 作为更安全的替代方案。第三个大型语言模型可以通过建议风险缓解措施来支持策略 A。这种由论证协议管理的交流有助于系统进行审议并达成决定。借助大型语言模型提升协商与共识能力将大型语言模型集成到协商和共识机制中,相较于通常依赖简单效用函数或预定义交互协议的传统方法,带来了多种优势。自然语言作为主要界面: 大型语言模型可以用自然语言进行协商和讨论,使得交互更加灵活、富有表现力,并且可能更容易被人类监督者理解。它们可以解释提案中的隐含意义、语境,甚至是情感,这对于纯符号智能体来说是困难的。智能体行为的提示策略: 大型语言模型智能体在协商或共识过程中的行为可以在很大程度上由其初始提示决定。您可以指示大型语言模型采取合作、竞争、让步或坚定的态度。提示还可以定义智能体的目标、约束、道德边界和备用方案。 例如,一个用于进入协商的大型语言模型智能体的提示可能包括:You are Agent Alpha. Your objective is to secure at least 60% of the shared computational resources for the upcoming 'DataCrunch' task, which is critical. You can concede down to 50% if Agent Beta provides a strong justification for their needs and offers a reciprocal benefit for a future task. Your opening proposal should be for 70%. Be polite but firm about the importance of 'DataCrunch'.动态适应与学习: 尽管不仅仅是简单的提示,大型语言模型智能体可能随着时间的推移,根据过去的交互调整其协商或论证策略。这可能涉及强化学习技术(如第五章所讨论的),以优化结果或提高协作效率。实际挑战与实施细节尽管功能强大,但使用大型语言模型进行协商和共识也带来挑战:确保真实性和一致性: 大型语言模型有时会“产生幻觉信息”,即生成貌似合理但不正确的信息。在协商中,如果未适当约束,大型语言模型可能会错误地陈述其能力或其需求的紧迫性。确保智能体如实行动并与整体系统目标保持一致,是一个重要的设计考量。管理复杂性和可扩展性: 涉及多个大型语言模型智能体的复杂多轮协商或论证对话可能计算成本高昂(由于重复的大型语言模型推理)且耗时。随着智能体数量的增加,可扩展性可能成为一个问题。协商通信的结构化: 即使使用自然语言,通信中的某些结构也是有益的。例如,协商消息可以封装在 JSON 对象中,该对象除了自然语言内容外,还包括元数据(发送方、接收方、协商 ID、提案类型)。这有助于交互的跟踪、日志记录和程序化处理。一个消息结构示例:{ "interaction_id": "NEG_XYZ_789", "sender_agent_id": "LLM_Negotiator_01", "recipient_agent_id": "LLM_Negotiator_02", "timestamp": "2023-10-27T10:30:00Z", "type": "COUNTER_OFFER", "negotiation_context": { "item": "Shared_GPU_Time_Slot_3", "previous_offer_id": "OFFER_ABC_123" }, "content": { "natural_language_proposal": "感谢您的提议。虽然我无法接受 3 小时,但我可以提议折衷为 4 小时,作为回报,我可以通宵处理您的低优先级“日志分析”任务。", "structured_terms": { "resource_id": "Shared_GPU_Time_Slot_3", "requested_duration_hours": 4, "reciprocal_service_offered": "LogAnalysis_overnight_processing" } } }这种混合方法结合了自然语言的表达能力和结构化数据的清晰度。在多智能体大型语言模型系统中成功实施协商和共识机制,需要精心设计智能体角色、通信协议,以及策略性地使用提示来引导大型语言模型行为。这些技术对于构建能够不仅沟通而且真正协作并就复杂问题达成一致的智能体团队来说,非常重要。