大型语言模型(LLM)代理代表了从标准大型语言模型向前迈进的一步,因为它们能够承担任务、具备一定程度的自主性运行,并与信息或系统交互以达成特定目的。为使这些功能更具体,这里展示了一些简单但有说明性的应用。这些例子将帮助您想象代理如何运作。请记住,这些是简化后的情景,旨在说明代理可能执行的类型功能。自动化邮件摘要与分类器设想一个旨在帮助您管理收件箱的代理。目标: 让您了解重要邮件,而无需阅读每一封。工作方式: 该代理可以连接您的电子邮件账户(当然,需要获得许可!)。对于每封新邮件,它会:读取内容。运用其LLM核心理解要点并生成简洁摘要。分析摘要和发件人信息,对邮件进行分类(例如,“紧急财务”、“项目更新”、“新闻简报”)。向您提供每日摘要和分类邮件的汇总,或者立即标记真正紧急的项目。这不仅仅是一个搜索关键词的脚本。该代理运用LLM的语言理解能力来解读邮件的含义,使其摘要和分类更准确、更有用,尤其是在措辞含糊的消息中。它根据持续流入的新信息(邮件)来完成其任务。它根据指令和理解来决定什么重要,而不仅仅是匹配模式。简易研究助手设想一个负责收集某个主题初步信息的代理。目标: 向用户提供某个主题的快速概览,信息来源于一组明确的信息源(例如公司内部知识库或特定网站合集)。工作方式:用户提供一个主题,例如,“可再生能源对当地社区的影响。”代理运用其LLM理解请求,并在需要时将其分解为可搜索的查询。它“访问”允许的信息源。这可能涉及查询数据库或使用简化的网页搜索功能,我们将在后续章节讲到“工具”时详细讨论。它读取并处理检索到的信息,识别相关段落。最后,它将这些信息综合成一份连贯的摘要或一个主要观点列表给用户。这个代理比简单搜索更进一步。它理解请求,规划基本的搜索策略,检索信息,然后对其进行推断,以生成新的、结构化的输出。digraph G { rankdir=TB; node [shape=box, style="rounded,filled", fillcolor="#e9ecef", fontname="sans-serif"]; edge [fontname="sans-serif"]; user_request [label="用户请求\n(例如,“可再生能源影响”)", fillcolor="#a5d8ff"]; decompose [label="代理:分解请求\n(识别要点)", fillcolor="#bac8ff"]; search [label="代理:访问信息源\n(搜索内部数据库/指定网站)", fillcolor="#bac8ff"]; synthesize [label="代理:综合信息\n(提取、组合、总结)", fillcolor="#bac8ff"]; report [label="代理:呈现报告\n(摘要、发现)", fillcolor="#74c0fc"]; user_request -> decompose; decompose -> search; search -> synthesize; synthesize -> report; }一幅图示,说明研究助手代理如何处理用户的请求。个人任务管理器我们许多人都使用待办事项列表。LLM代理可以使这种体验更具活力和直观性。目标: 通过自然语言交互,帮助用户高效管理任务,保持井然有序。工作方式:用户可以用自然语言告诉代理添加任务:“提醒我明天下午给水管工打电话”或“将‘准备演示文稿’添加到我的工作任务中。”代理理解这些指令,提取任务描述和截止日期/时间等重要信息,并将它们添加到任务列表中。它可以在适当的时间提供提醒,而无需在特定时刻主动提示。它可能会根据用户随时间提及的推断项目名称或背景来分类任务(例如,区分“工作”任务和“个人”任务)。标准的待办事项应用程序只是存储任务,而基于代理的任务管理器则运用其语言理解能力,使交互更流畅。它可以解释非结构化命令,并根据这些解释执行操作。当它发送提醒时,便体现出其“自主性”;它被赋予了这项任务,并在条件(时间)满足时自主执行。客户支持分流代理在商业环境中,代理可以帮助管理最初涌入的客户支持请求。目标: 通过快速理解客户问题并进行适当引导,或立即回答常见问题,从而提高客户服务效率。工作方式:客户在聊天窗口输入问题或发送邮件。代理读取查询。运用其LLM功能,它确定问题的性质(例如,账单问题、技术问题、产品咨询)。它试图理解用户的意图。基于这种理解,它可以:如果问题是其可访问的常见问题(FAQ)数据库中找到的常见问题,则提供即时答案。将查询路由到正确的人工支持团队(例如,“账单部门”,“二级技术支持”)。如果初始查询过于模糊,无法做出确定判断,则提出澄清问题。这类代理需要处理各种人类语言,包括非正式措辞、错别字或沮丧情绪的表达。它比纯粹依赖关键词匹配的系统更具适应性,因为LLM帮助它把握用户意图。这使得更智能的路由和更快速地解决常见问题成为可能,从而解放了人工代理去处理更复杂的问题。这些例子说明了LLM代理如何承担多种角色。它们不仅仅像聊天机器人那样被动地回应输入,而是积极地朝着目标努力,有时涉及多个步骤并与信息系统交互。随着课程的推进,您将了解促成这些行为的组成部分。