趋近智
当我们讨论大型语言模型(LLM)智能体时,它们与简单程序甚至基本LLM交互的不同之处在于其自主能力。但在这里,“自主性”到底指什么?它并非指智能体拥有自己的秘密计划或愿望。相反,它是指智能体在无需人类指示每个步骤的情况下,操作并做出决策以达成指定目标的能力。
想想使用简单计算器与委托研究任务之间的区别。使用计算器时,你一步步输入数字和操作,它完全是被动的响应。而一个LLM智能体,当被赋予“查找伦敦当前天气并总结明天的预报”这样的目标时,它能够自行采取一系列行动。它可能会决定使用搜索工具、解析结果,然后形成摘要,这一切都无需你手动指导每个子任务。这种朝向目标的自主推进,正是智能体自主性的核心所在。
这种操作自由与传统自动化脚本形成鲜明对比。脚本就像一个非常严格的食谱:它遵循预设的命令序列,不能偏离。如果出现意外情况,脚本通常会失败或产生不正确的结果。LLM智能体凭借大型语言模型的推理能力,具备更大的灵活性。尽管其行动仍受其编程和LLM训练的指引,但它能以更具动态性的方式解释情况并选择下一步行动。
需要理解的是,这种自主性并非无限。智能体在开发者设定的范围内运作。它们被赋予特定目标,能够使用一套限定的工具(我们将在第4章中进一步说明),其“思考”基于它们所用LLM中存在的模式和信息。它们不具备意识或个人意图。它们的自主性是一种功能性能力,使它们能够以一定程度的自我管理来达成目标。
下图展示了不同的任务执行模式,突出了智能体自主性与直接人工控制和固定脚本的区别:
该图展示了一种演进:直接人工控制的每一步都需要持续输入。固定脚本自动化了序列但无法适应。具备自主性的智能体可以接收一个目标,然后循环进行观察、思考和行动,以朝着该目标前进。
那么,为什么这种自主性有益呢?
设想你给同事分配一项任务,比如:“请查明Alpha项目的项目经理是谁,获取他们的电子邮件地址,并替我草拟一封询问简要状态更新的介绍性邮件。”你的同事不需要你告诉他们如何找到项目经理(例如,查看内部目录、询问其他团队成员),也不需要你告诉他们草稿中每一句话的具体措辞。他们有一个目标,并具备自主决定中间步骤的能力。大型语言模型智能体力求实现类似的职能自主性,尽管是在一个更结构化和数字化的范畴。
这种具备一定自主性进行操作的能力,是使大型语言模型智能体变得强大的根本所在。在学习本课程的过程中,你将了解更多关于规划(第5章)、工具(第4章)和记忆(第6章)等组成部分,它们支持并塑造了这种自主性,使智能体能够执行日益复杂的任务。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造