趋近智
LLM代理不会仅仅完成一项任务就停止;它以持续的循环方式工作。可以这样理解:一个代理观察其所处环境(或任务的当前状态),根据这些观察和其目标思考下一步做什么,然后采取行动。这个序列不是一次性发生的。它会重复,让代理能够取得进展,适应新信息,并努力完成更复杂的任务目标。这个基本的重复过程通常被称为代理的运行循环。它说明了代理如何从简单地处理语言,到执行一系列行动。
让我们来细分这个循环的主要阶段:
观察(收集信息) 代理在每个循环中的第一步是收集信息。这种“观察”可以有多种形式。它可能是你给出的初始指令,例如“为我总结这份文档”。它也可能是代理之前采取行动的结果,比如“搜索查询返回了三篇文章”或“尝试访问文件时发生错误”。或者,它可能是来自外部来源的新数据。本质上,代理正在收集它做出知情决策所需的当前数据点。这个步骤通常涉及检查其短期记忆,以理解当前情况相对于过去交互的背景。
思考(处理和规划) 一旦代理有了观察结果,它就需要“思考”。这是大型语言模型(LLM),即代理的大脑,开始工作的阶段。LLM处理从观察中获得的新信息,考虑其总体目标(由其初始指令或提示定义),并决定下一步。这可能包括:
行动(执行和交互) 在“思考”阶段之后,代理“行动”。行动是代理执行的任何操作。这可能是:
这种观察-思考-行动的循环随后重复。行动的结果(例如,工具检索到的天气信息,或工具失败时的错误消息)成为循环下一次迭代的新观察结果。代理观察这个新状态,思考它在其目标背景下的含义,并决定随后的行动。这个过程会一直持续,直到代理成功完成其总体任务或被指示停止。
LLM代理的运行循环涉及重复观察情况、思考下一步并采取行动,直到达成总体目标。
这种运行循环使代理对各种任务特别有效。这种循环过程不是单一输入产生单一输出,它使代理能够:
你可以看到,我们本章中讨论的代理核心组成部分,都这个循环中发挥各自的作用:
理解这种观察-思考-行动循环,是理解LLM代理如何运作并完成它们被设计用来执行的任务的根本所在。在下一节“简化的代理工作流程”中,我们将查看一个更具体的逐步示例,说明这个循环在实践中的应用。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造