章节 5: 智能体群体中的推理与决策

在智能体架构、通信和工作流编排已到位的情况下，本章着重介绍驱动智能体行为的推理 (inference)和决策过程。我们首先考察单个大型语言模型智能体如何执行复杂的推理任务。接着，我们将讨论如何扩展这些个体能力，使智能体群体能够进行集体推理，并做出协调的决定以解决共同的问题。

本章将引导您学习单个智能体的推断技术，包括像ReAct和思维链这样的方法。接下来您将了解到为集体推理而汇集知识的方法，以及分布式问题解决的途径。我们还将涵盖运用博弈论思想的智能体策略性交互，介绍多智能体强化学习 (reinforcement learning)（MARL）以培养协调行为，并审视智能体如何进行适应性学习。本章最后会考量智能体心理状态的表示方法，例如信念-欲望-意图（BDI）模型。

课程章节

5.1 个体智能体的推断方法
5.2 知识汇总与群体推理
5.3 分布式问题解决方法
5.4 策略性互动：博弈论要素
5.5 多智能体强化学习用于协调 (进阶)
5.6 智能体的学习适应行为
5.7 智能体心智状态：信念、愿望、意图
5.8 动手实践：实现一个协作问题处理任务