趋近智
每个 LLM 代理的中心是其认知引擎:大型语言模型本身。如果一个代理被设计为智能地执行任务,那么 LLM 就是负责“智能”部分的组件。它是大脑,是解释信息、做出决策和生成响应的中央处理器。
你可能已经知道,LLM 是经过大量文本数据训练的复杂人工智能模型。这种训练使它们具有理解、生成和处理人类语言的显著能力。在代理的背景下,LLM 使用这些能力不仅用于对话,还用于推动行动。这使代理能够摆脱预设响应,表现出更灵活、以目标为导向的行为。
那么,LLM 究竟如何作为这个中心核心发挥作用呢?它的作用可以分解为几个主要职责:
理解输入:LLM 在代理中的首要任务是理解当前的任务和上下文。输入可以来自不同来源:
推理和决策:一旦理解输入,LLM 就会进行某种形式的推理。它“思考”实现目标需要哪些步骤。这可能包括:
生成用于行动和沟通的输出:根据其推理,LLM 然后生成一个输出。这个输出不总是对您的直接回答。通常,它是给代理其他部分的指令,或是要传递的响应:
可以将 LLM 想象成一位非常熟练的人类私人助理。您给助理一个任务。他们会听取并理解(输入)。他们会思考完成任务的最佳方法,也许会查找一些信息,使用应用程序或打电话(推理和工具使用)。他们会采取必要的行动,然后向您报告结果或询问更多信息(输出和沟通)。LLM 扮演着助理的角色,但其‘思考’和‘行动’是通过软件指令以及与其他数字组件的交互来完成的。
为代理选择的特定大型语言模型会显著影响其能力。有些 LLM 更擅长编码,另一些擅长创意写作,还有一些则优化用于精确地遵循复杂指令。尽管 LLM 的详细选择是一个更高级的话题,但在当前阶段,了解您的代理的“大脑”可以有不同的类型,每种都有其优点和缺点,这是有帮助的。这种选择将直接影响您的代理理解请求、对问题进行推理以及选择适当行动的程度。
下图说明了 LLM 如何作为代理操作的中心,处理各种输入并产生推动代理行为的输出。
LLM 充当中央处理中心,接收信息、进行推理并确定代理的下一步行动或响应。
如果没有 LLM 的理解、推理和生成能力,代理将仅仅是一个预定义的脚本。正是这个中心组件使代理能够以更动态、更智能的方式处理任务。当我们了解工具和记忆等其他组成部分时,请记住,LLM 通常是决定如何以及何时使用这些其他部分的组件。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造