推理架构的比较分析

ReAct、自问（Self-Ask）、思维树（ToT）以及图基推理 (inference)等推理架构的比较分析，为设计高效智能体系统提供了基础。选择合适的推理架构是一个重要的设计决定，它影响着智能体的性能、成本、复杂性以及对特定任务的适用性。本次分析旨在提供一个框架，以便基于每种方法固有的权衡做出明智选择。

我们将从几个对构建高效智能体系统很重要的方面对这些架构进行评估：

推理结构： 思维、行动和观察的基本组织方式。
问题适应性： 该架构通常表现出色的任务类型。
探寻能力： 考虑多种备选方案或路径的能力。
实现复杂度： 实现核心逻辑所需的工程工作量。
计算成本： 主要通过LLM推理次数和开销衡量。
控制与调试： 引导、理解和故障排除智能体行为的便捷性。

推理 (inference)框架比较

特性	ReAct（推理+行动）	自问	思维树（ToT）	图基推理
推理结构	线性：思维 -> 行动 -> 观察	线性：问题 -> 子问题 -> 答案	树/图：探寻多个思维路径	通用图：节点与边
问题适应性	工具使用、任务执行、简单规划	事实核查、问答、信息分解	复杂规划、探寻、创意任务	复杂状态/规划管理
探寻能力	低（单路径）	低（子问题路径）	高（思维分支）	高（取决于图结构/算法）
实现	中等	低到中等	高	非常高
计算成本	中等（每步）	中等（每次分解）	高（多次并行评估）	可变（取决于图的复杂性）
控制/调试	中等（追踪线性流程）	中等（追踪问题分解）	困难（追踪树/搜索）	困难（检查复杂图状态）
事实性侧重	间接（通过观察）	高（明确为此设计）	中等（通过评估/剪枝）	间接（取决于实现）

权衡考量

ReAct： 它的优势在于推理 (inference)和行动的紧密结合，使其非常适用于需要频繁与外部环境或工具交互的智能体。与更复杂的、有分支的结构相比，线性的 思维 -> 行动 -> 观察 循环相对容易实现和调试。然而，这种线性也是它的主要局限。ReAct只遵循单一路径；如果一个思维或行动不理想或有误，智能体可能难以恢复，除非有精密的错误处理或回溯机制，而这些并非ReAct基本框架固有的。它的计算成本随完成任务所需的步骤数而变化。

自问： 这种架构专门为提高LLM针对复杂问题生成答案的事实准确性而构建。通过强制LLM分解问题并寻求中间答案（通常通过搜索工具），它能减少幻觉 (hallucination)，并将最终的综合建立在证据之上。它的实现通常比ReAct或ToT简单。然而，它更不像是通用的智能体架构。它没有定义广泛规划或执行超出提问后续问题或执行查询以外动作的机制。它擅长问答，但并非为需要大量规划或交互序列的任务而设计。

思维树（ToT）： ToT在推理过程中引入了明确的探寻机制。通过在每个阶段生成多个潜在的“思维”（中间步骤或解决方案）并进行评估，它允许智能体在一个推理路径的搜索空间中导航。这使得它对于最优路径并非显而易见的任务非常有用，例如复杂规划、数学问题解决或需要考虑多种途径的创意生成。像BFS或DFS这样的架构可以应用于遍历这个思维树， $G=(V, E)$ 。主要缺点是实现复杂性和计算成本。管理树结构、实现有效的评估启发式方法以及执行大量的LLM调用（用于生成和评估）使得ToT比ReAct或自问模型对资源的需求显著更高。调试时需要检查已探寻的树，这可能具有挑战性。

ReAct（线性行动导向）、自问（线性分解）和思维树（分支探寻）的推理流程比较。

图基推理： 这与其说是一种单一架构，不如说是一种灵活方法。使用明确的图结构（ $G=(V, E)$ ，其中 $V$ 代表状态/观念， $E$ 代表关系/转换）为建模复杂关系、详细规划和长期依赖提供了最高的能力。它允许使用精密的图算法进行规划、状态跟踪和知识表示。然而，这种灵活性也带来了大量的工程开销。设计合适的图模式、定义节点和边的语义、实现图更新逻辑以及选择遍历或推理算法，都需要对图论和特定问题所在有扎实的专业知识。其复杂性和计算成本高度依赖于具体的图实现。尽管它功能强大，但对于简单任务来说往往过于复杂，并且是所讨论选项中实现复杂度最高的。

选择合适的架构

对于主要涉及顺序工具使用和与环境交互、且线性计划通常足以应对的任务，ReAct 提供了一个均衡的起点。
当主要挑战是确保复杂问题（需要信息综合）的事实准确性时，自问提供了一种有针对性且有效的机制。
对于要求探寻多样策略、创意生成或在复杂搜索空间中寻找最优解决方案的问题，如果计算预算和实现复杂度可接受，ToT 是一个有力的选择。
当处理高度互联的信息、复杂状态管理或需要针对复杂依赖关系自定义规划算法时，图基推理 (inference) 提供了最适应（尽管最复杂）的底层框架。

值得注意的是，混合方法也是可行的。例如，在ToT结构中评估节点可能涉及一个类似ReAct的工具使用子过程，或者一个图结构可以用于管理ToT智能体探寻的状态。选择最终取决于对任务要求、性能需求和可用资源的仔细分析。理解这些权衡对设计精密高效的LLM智能体而言不可或缺。

使用 Kerb 更快构建 LLM 应用

简洁的语法。内置调试功能。从第一天起就可投入生产。

为 ApX 背后的 AI 系统而构建

这部分内容有帮助吗？

参考文献

ReAct: Synergizing Reasoning and Acting in Language Models, Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao, 2023 arXiv preprint arXiv:2210.03629 DOI: 10.48550/arXiv.2210.03629 - 介绍了ReAct框架，将推理（思考）和行动（动作）步骤交织在一起，使LLM能够进行动态推理以创建、维护和调整行动计划，并与外部环境交互。
Tree of Thoughts: Deliberate Problem Solving with Large Language Models, Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Thomas L. Griffiths, Yuan Cao, Karthik Narasimhan, 2023 Advances in Neural Information Processing Systems (NeurIPS) 36 DOI: 10.48550/arXiv.2305.10601 - 提出了Tree of Thoughts框架，通过允许LLM探索多个推理路径并评估中间思考来推广思维链提示，从而在复杂任务中实现更强大的问题解决能力。
Graph of Thoughts: Towards Large Language Model Based Cognitive Architectures, Maciej Besta, Nils Blach, Ales Kubicek, Robert Gerstenberger, Michal Podstawski, Lukas Gianinazzi, Joanna Gajda, Tomasz Lehmann, Hubert Niewiadomski, Piotr Nyczyk, Torsten Hoefler, 2024 Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 38 (Association for the Advancement of Artificial Intelligence (AAAI)) DOI: 10.1609/aaai.v38i16.29720 - 将Tree of Thoughts概念扩展到更通用的图结构，使LLM能够更灵活地管理和操作复杂的思维过程，支持高级推理和规划。
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela, 2020 Advances in Neural Information Processing Systems (NeurIPS) 33, Vol. 33 DOI: 10.48550/arXiv.2005.11401 - 介绍了检索增强生成（RAG），这是一种通过将生成过程建立在检索到的文档上，从而提高LLM事实准确性并减少幻觉的基本方法，与“自我提问”方法的事实基础目标高度相关。