趋近智
尽管像 ReAct 这样的框架擅长以序列方式交织推理和行动,但当面对需要考虑多种可能性或大量回溯的问题时,它们有时会显得不足。复杂的任务通常涉及搜索空间,其中最佳路径并非显而易见,单一的推理路径可能导致死胡同。在这种情况下,思维树(ToT)架构提供了一个有力的替代方案。
ToT 明确地将问题解决过程建模为在推理步骤(或称“思维”)树中的查找。ToT 不会在每一步都只依赖于单一的思维或行动,而是允许代理生成多个潜在思维,评估它们的价值,并有策略地检查推理树中最可行的分支。这种方法与人类解决问题的方式相似,我们在进行下一步之前通常会考虑多种选择。
ToT 过程可以分解为在树状结构中管理的几个不同操作,该结构通常表示为图 ,其中节点 是状态(表示部分解决方案或中间思维),边 表示基于生成的思维在状态之间的转换。
思维生成: 在树中的任何给定节点(状态),会提示大型语言模型(LLM)生成多个()不同的潜在下一步或延续。这些“思维”代表了从当前状态处理问题的不同方式。例如,如果解决一个数学问题,不同的思维可能对应于应用不同的定理或代数运算。提示可能明确要求多种多样的延续。
状态评估: 每个生成的思维都会引向一个新的潜在状态。ToT 的一个重要组成部分是评估这些状态质量或前景的能力。这种评估引导搜索过程。评估可以通过以下方式进行:
搜索算法: 有了生成的思维和评估过的状态,搜索算法会查看这棵树。常见的选择包括:
搜索会持续进行,直到达到目标状态,资源(如计算预算或最大深度)耗尽,或没有有前景的分支剩余。
思维树查找过程的简化表示。节点代表从思维派生出的状态,颜色表示评估分数(绿色=高,黄色=中,红色=低/已剪枝),搜索会朝着目标状态推进。
ToT 显著增强了代理应对以下类型问题的能力:
与 ReAct 的线性思维-行动循环相比,ToT 允许在提交行动或结束推理步骤之前进行并行查找和明确的替代方案比较。它通过将 LLM 生成多样文本的固有能力构建为对可能推理链空间进行的搜索问题,从而提供了一种结构化的管理方式。
有效实施 ToT 需要仔细考虑几个方面:
思维树代表了 LLM 代理在实现更审慎推理方面迈出的一大步。通过将中间推理步骤的生成和评估构建为搜索过程,ToT 使代理能够处理超出简单线性架构的复杂问题。尽管计算上更为密集,但它查找、评估和回溯的能力使其成为需要精密问题解决能力的任务的宝贵工具。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造