趋近智
大型语言模型(LLM)不仅仅是复杂的文本预测器;它们正在成为能够行动的系统的中心。虽然标准的LLM或简单的聊天机器人主要通过根据您的输入生成文本来进行对话,但LLM代理则更进一步。但这个“更进一步”到底意味着什么?LLM代理究竟是什么?
就其本质而言,一个LLM代理是一个旨在达成特定目标的系统。它使用LLM作为其主要的推理引擎,就像大脑一样,用于理解指令、做出决策和规划行动。与仅仅向LLM提问并获得文本回复不同,代理的设计是为了与周围环境互动以完成任务。
可以这样理解:
大型语言模型是赋予代理智能的主要组成部分。当代理获得一项任务时,例如“找到我附近现在营业且意大利面评价不错的前三家意大利餐厅”,LLM不会仅仅尝试从其训练数据(可能已过时)中回忆这些信息。相反,它会推理如何达成这个目标。
它可能会将任务分解为:
这种推理会促使行动。代理通常配备有工具,这实际是函数或与其他服务的连接,让它们能够与环境互动。以我们的餐厅为例,工具可能包括:
LLM决定计划当前步骤中哪个工具是合适的,为该工具制定正确的输入(例如,搜索查询),然后解释工具的输出以决定下一步行动。如果某个工具失败或返回意外信息,LLM可以推理如何进行,也许是尝试不同的工具或调整其方法。
许多代理都遵循一个被称为“观察、思考、行动”的基本循环:
这个循环会重复,直到目标达成,或代理确定无法达成。
下面是一个描绘此一般流程的图表:
此图描绘了代理如何接收用户目标,使用其LLM“大脑”决定行动,利用工具与环境互动,然后观察结果以指导其下一步。
所以,总结来说,LLM代理的特点是:
正是LLM推理能力与采取行动并与环境互动的能力相结合,才真正定义了LLM代理。它是一个从简单的文本生成转变为积极参与完成任务的系统。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造