趋近智
为了让代理系统的抽象想法更具体,这里分析一个AI代理执行任务的简化示例。此示例说明了包括LLM、工具、内存(即使是基础的)和提示在内的组成部分如何协同工作。目标是观察并了解代理的决策过程,即使是在模拟环境中。
假设用户问我们的AI代理:“法国的首都是哪里,它目前的居住人口是多少?”
这是一个直接的问题,但它可能要求代理执行多个步骤:识别所需的两部分信息,获取它们(可能借助工具),然后综合答案。
为进行此次演示,我们的代理配备了:
web_search(query: str) 工具: 这个工具允许代理在互联网上查找信息。它接受一个字符串形式的搜索查询,并返回包含搜索结果的文本片段。为了指导代理的行为并确保其遵循结构化方法,我们为其提供了一个“主提示”或一组系统级指令。这个提示概述了代理应如何思考、行动和使用其工具。它是代理行为提示工程的一个非常基本的要素。
以下是这样一个主提示的示例,它促使代理形成类似ReAct(推理与行动)的循环:
你是一个AI助手。你的任务是准确回答用户的问题。
你可以使用以下工具:
- web_search(query: string): 根据查询在互联网上搜索信息并返回摘要。
要回答问题,请重复以下步骤:
1. 思维:简要说明你的计划或下一步将采取的行动。
2. 行动:指定要使用的工具及其输入。如果你有了答案,请声明 'Final Answer:'。
3. 观察:记录工具的结果。
根据需要重复步骤1-3,直到你能提供最终答案。
用户问题:法国的首都是哪里,它目前的居住人口是多少?
这个提示明确告诉了代理:
思维)、工具使用(行动)和处理工具输出(观察)的结构化格式。Final Answer:)。现在,让我们模拟代理在主提示的指导下,处理用户问题时的内部思考和行动。
第一次迭代:查找首都
web_search("capital of France")web_search 工具被调用。它查询搜索引擎并处理结果。)此时,代理已成功获取第一部分信息。“观察结果”现在是其工作上下文的一部分。
第二次迭代:查找居住人口
web_search("current population of Paris")web_search 工具再次被调用。)代理现在已获取第二部分信息。
第三次迭代:综合最终答案
Final Answer: 法国首都是巴黎,其目前居住人口约210万。代理发出信号表示它已得到完整答案,整个过程结束。
这个简单的执行轨迹展现了代理系统的几个重要方面:
web_search 工具制定了适当的查询。主提示对工具的描述对此很重要。代理的操作可以被可视化为一系列状态和转换,由其内部推理和与工具的互动驱动。
图示代理在信息获取任务中的迭代思维-行动-观察循环。
此图显示了代理如何循环地进行思考、行动(通常涉及工具)和观察结果,更新其内部状态或上下文,直到它能生成最终答案。
本次动手实践分析虽然简化,但直接关联到本章的起始主题:
web_search 工具作为外部能力,以及隐式使用短期记忆(上下文窗口)来连接步骤。思维:、行动:、观察: 格式是一种基于提示的机制。思维 -> 行动 -> 观察 循环镜像了ReAct等代理架构的核心循环,我们对此进行了简要介绍。这个示例提供了一个实用的视角,展示了此类架构如何运作。通过剖析一个简单的代理任务,我们开始认识到不同组成部分如何协同工作,以及仔细的提示设计所扮演的重要作用。随着课程的进行,我们将在这些基本原理上继续,构建和管理更复杂的代理工作流。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造