在智能体架构、通信和工作流编排已到位的情况下,本章着重介绍驱动智能体行为的推理和决策过程。我们首先考察单个大型语言模型智能体如何执行复杂的推理任务。接着,我们将讨论如何扩展这些个体能力,使智能体群体能够进行集体推理,并做出协调的决定以解决共同的问题。本章将引导您学习单个智能体的推断技术,包括像ReAct和思维链这样的方法。接下来您将了解到为集体推理而汇集知识的方法,以及分布式问题解决的途径。我们还将涵盖运用博弈论思想的智能体策略性交互,介绍多智能体强化学习(MARL)以培养协调行为,并审视智能体如何进行适应性学习。本章最后会考量智能体心理状态的表示方法,例如信念-欲望-意图(BDI)模型。