趋近智
在智能体架构、通信和工作流编排已到位的情况下,本章着重介绍驱动智能体行为的推理和决策过程。我们首先考察单个大型语言模型智能体如何执行复杂的推理任务。接着,我们将讨论如何扩展这些个体能力,使智能体群体能够进行集体推理,并做出协调的决定以解决共同的问题。
本章将引导您学习单个智能体的推断技术,包括像ReAct和思维链这样的方法。接下来您将了解到为集体推理而汇集知识的方法,以及分布式问题解决的途径。我们还将涵盖运用博弈论思想的智能体策略性交互,介绍多智能体强化学习(MARL)以培养协调行为,并审视智能体如何进行适应性学习。本章最后会考量智能体心理状态的表示方法,例如信念-欲望-意图(BDI)模型。
5.1 个体智能体的推断方法
5.2 知识汇总与群体推理
5.3 分布式问题解决方法
5.4 策略性互动:博弈论要素
5.5 多智能体强化学习用于协调 (进阶)
5.6 智能体的学习适应行为
5.7 智能体心智状态:信念、愿望、意图
5.8 动手实践:实现一个协作问题处理任务
© 2026 ApX Machine Learning用心打造