趋近智
在构建更自主、更智能的智能体时,仅仅告诉智能体做什么通常是不够的。为了让智能体有效处理复杂的多步骤任务,它们需要像人类一样“思考”问题。两种提示框架,思维链(CoT)和思维树(ToT),能够引导智能体的推理过程,从而使任务执行更可靠。这些技术对于提升智能体控制不可或缺。
思维链提示鼓励大型语言模型(LLM)在得出最终答案或行动之前,逐步阐明其推理过程。智能体不会直接输出解决方案,而是首先生成一系列中间思考,这些思考逻辑地引出结果。
对于智能体工作流程,CoT 非常有帮助,原因如下:
您可以通过以下几种方式在智能体提示中引导 CoT:
User: 规划一个为期三天的巴黎之旅,侧重于艺术博物馆和历史遗迹。
Agent Prompt:
你的任务是规划一次旅行。请一步一步地思考来构建行程。
Thought:
用户想要一个为期三天的巴黎之旅,侧重于艺术和历史。
第1天:侧重中心历史遗迹。上午:巴黎圣母院(外观/区域),圣礼拜堂。下午:卢浮宫。
第2天:侧重艺术和另一个街区。上午:奥赛博物馆。下午:蒙马特高地和圣心大教堂。
第3天:凡尔赛宫或不同类型的博物馆。上午:凡尔赛宫(至少需要半天)。下午:罗丹博物馆或游览玛莱区以感受历史氛围。
我应该将其呈现为一个结构化的计划。
Action:
{
"plan": [
{"day": 1, "morning": "巴黎圣母院区域和圣礼拜堂", "afternoon": "卢浮宫"},
{"day": 2, "morning": "奥赛博物馆", "afternoon": "蒙马特高地和圣心大教堂"},
{"day": 3, "morning": "凡尔赛宫", "afternoon": "罗丹博物馆或玛莱区游览"}
]
}
通过鼓励有条理的方法,CoT 帮助智能体在内部模拟解决问题的路径,使其行动更审慎,更不容易出现简单错误。
虽然 CoT 引导智能体沿着单一的线性推理路径前进,但思维树提示将其推进了一步。ToT 使得智能体能够同时审查多个推理路径或备选方案,评估它们的潜力,然后决定要沿着哪条路径执行,或者结合不同路径的见解。这类似于智能体在采取行动之前考虑几种“如果……会怎样”的场景或不同的策略。
当出现以下情况时,ToT 对智能体尤其有益:
实现一个完整的 ToT 系统通常不仅仅涉及单个提示;它通常需要一个智能体架构,该架构可以管理多个“思考状态”,为每个状态生成潜在的下一步(思考),评估这些思考,并使用搜索算法(如广度优先或深度优先搜索)来遍历思考的“树”。
然而,您可以设计提示,鼓励智能体在其推理循环中表现出类似 ToT 的行为:
例如,一个负责调试代码的智能体可能会使用类似 ToT 的提示:
User: 数据处理的 Python 脚本在处理大文件时出现 MemoryError 错误。
Agent Prompt:
分析问题并提出解决方案。考虑多种方法。
Thought:
用户的脚本在处理大文件时出现 MemoryError。这通常意味着它一次性加载了太多数据到内存中。
方法 1:分块处理文件。
- 优点:处理大文件内存问题的标准解决方案。降低峰值内存使用。
- 缺点:如果数据依赖存在于不同块之间,可能会使处理逻辑复杂化。
方法 2:优化数据结构。
- 优点:可以在不根本改变文件 I/O 的情况下减少内存占用。
- 缺点:如果文件确实非常大,可能不够。取决于数据和当前结构的具体情况。
方法 3:使用更节省内存的库或工具。
- 优点:可能存在现成的解决方案(例如,Python 的 Dask、Vaex)。
- 缺点:引入新的依赖;可能需要学习新的 API。
Evaluation: 分块(方法 1)通常是解决这类问题最直接有效的第一步。我会建议这个方法,如果分块对于他们特定的逻辑难以实现,也许会作为次要考虑提及数据结构优化。
Action:
{
"suggestion": "为了解决 MemoryError,最常见的解决方案是分块处理文件,而不是一次性将整个文件加载到内存中。您可以读取文件的一部分,处理它,然后再读取下一部分。您能向我展示您脚本中读取和处理文件的部分吗?或者,考虑您的数据结构是否可以优化以提高内存效率(例如,使用生成器、更紧凑的类型)。",
"next_step": "request_code_snippet"
}
以下图表说明了 CoT 和 ToT 之间推理流程的差异:
CoT 展示了思考的线性进展,而 ToT 则说明了分叉结构,其中审查了多条推理路径。
CoT 和 ToT 之间的选择取决于任务的复杂性以及期望的智能体自主程度:
何时使用 CoT:
何时考虑 ToT(或类似 ToT 的提示):
尽管这些技术功能强大,但它们也伴随着一些考量:
通过整合 CoT 和 ToT 提示策略,您不仅仅是向智能体提供指令;您是在塑造其认知过程。这使得智能体可以执行的任务复杂性有了显著提升,使它们从简单的指令执行者转变为更强大的问题解决者。这些推理框架是您精确控制智能体的宝贵工具,帮助您构建不仅高效,而且更透明和适应性强的智能体。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造