为LLM智能体选择大型语言模型(LLM),即其“大脑”和核心推理引擎,是其构建的一个主要环节。对于你的第一个智能体,选择过程应优先考虑易用性和学习便利性,而不是追求市面上最强大或最复杂的模型。为你的第一个LLM选择标准在构建你的第一个智能体时,有些因素比其他因素更重要。你希望能够快速启动并运行,以看到你的智能体发挥作用。以下是你需要考虑的:通过API便捷获取: 大多数LLM都由公司通过应用程序编程接口(API)提供。API本质上是你的程序通过互联网向LLM服务发送请求并接收响应的一种方式。这通常是最简单的开始方式,因为你不需要自己下载或管理大型模型文件。你通常会向提供商注册,获得一个“API密钥”(一个识别你程序的唯一秘密代码),然后就可以开始进行调用了。成本效益: 许多LLM提供商为新用户提供免费套餐或额度,这非常适合你的初次试用。即使是付费套餐,也通常采用按使用量付费模式,即根据你处理的文本量收取很少的费用。对于一个简单的第一个智能体,这些费用可能很低,让你在没有重大经济投入的情况下进行学习。满足简单任务的能力: 你的第一个智能体很可能会处理一个直接的任务,比如管理待办事项列表,我们稍后会进行构建。你不需要为此使用绝对最大或最先进的模型。大多数广泛可用的LLM都完全能够理解简单的指令,并为基本的智能体行为生成适当的文本或决策。良好文档和社群支持: 当你刚开始时,清晰的说明和示例非常有帮助。提供良好文档、教程并拥有活跃用户社群的提供商,在你遇到问题时,可以使你的学习过程更顺利。通过API流行的LLM选项几家公司通过API提供访问有能力的LLM,这使得它们成为你第一个智能体的很好的选择。以下是一些常见选项:OpenAI: 以GPT-3.5-Turbo和GPT-4等模型闻名。OpenAI提供文档完善的API,是许多开发者青睐的选项。GPT-3.5-Turbo通常为初始项目提供了能力和成本的良好平衡。Anthropic: 提供诸如Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus等模型。Haiku设计为快速且具成本效益,是一个很好的起点。Sonnet则提供了智能与速度的平衡。他们的模型因强大的推理能力和实用性而受认可。Google: 通过Google AI Studio或Vertex AI平台提供对其Gemini系列模型的访问,例如Gemini Pro。这些是强大且多功能的模型,适用于多种任务。要使用其中任何一个,你通常需要:访问提供商的网站(例如,OpenAI、Anthropic、Google AI)。注册一个账户。导航到他们的开发者或API部分。生成一个API密钥。请妥善保管此密钥,因为它是你访问服务的凭证。对于本课程,我们将主要侧重于通过它们的API使用这些模型,因为这是构建你的第一个智能体最直接的途径。API途径:为什么它适合初学者通过API使用LLM意味着你的智能体代码将向LLM提供商发出网络请求。你的代码发送提示(你的指令和上下文),提供商运行LLM的服务器会处理它并返回响应。digraph G { rankdir=TB; node [shape=box, style="filled", fillcolor="#e9ecef"]; edge [color="#495057"]; "智能体代码" -> "LLM API" [label="发送提示"]; "LLM API" -> "LLM" [label="处理"]; "LLM" -> "LLM API" [label="返回输出"]; "LLM API" -> "智能体代码" [label="接收输出"]; }使用基于API的LLM时的交互流程。你的智能体代码通过互联网与LLM通信。尽管也可以在你自己的电脑上本地运行一些LLM(特别是使用Ollama或Hugging Face Transformers等工具的小型开源模型),但这通常涉及更多设置,可能需要特定硬件和更多技术步骤。对于你的第一个智能体,API方法显著降低了门槛。我们建议从API开始,以首先专注于智能体的逻辑。为你的第一个智能体做出选择那么,你应该选择哪一个呢?对于你的第一个智能体,特定LLM的选择,相对而言,没有理解其集成过程那么要紧。如果你想要一个广泛使用且拥有丰富教程的选项: OpenAI的GPT-3.5-Turbo是一个稳妥的开始。如果你对以安全性和详细推理能力闻名的模型感兴趣: Anthropic的Claude 3 Haiku是一个优秀且具成本效益的选择。如果你已经身处Google生态系统或想尝试他们最新的产品: Google的Gemini Pro是一个很好的候选。大多数通过这些API获得的现代LLM都相当有能力。选择一个对你来说易于使用的,注册API密钥,你就可以为后续步骤做好准备了。通过集成一个基于API的LLM所学的原理,在很大程度上是可迁移的,即使你以后决定尝试不同的模型。最重要的是开始动手,看看你的智能体如何根据你提供的LLM开始思考和行动。