在了解了大型语言模型的不同类别,从基础巨头到专用工具,并思考了开放模型和封闭模型之间的区别之后,一个实际的问题出现了:你究竟如何与这些模型进行互动?知道它们存在是一回事;使用它们又是另一回事了。从根本上说,访问和使用LLM(特别是预训练模型)主要有两种方法:基于网络的界面和应用程序编程接口(API)。每种方法都适应不同的需求和技术参与程度。网页界面:直接路径可以将网页界面看作是由LLM创建者或第三方服务商提供的专用网站或在线工具。这些界面是为了直接的人机交互而设计。你通常会将提示输入文本框中,或许会使用滑块或下拉菜单调整一些简单设置,然后点击按钮从模型获取响应。优点:易于使用: 网页界面通常非常直观,不需要编程知识。如果你会使用网页浏览器,你很可能就能使用LLM的网页界面。即时反馈: 你能快速获得结果,这对于尝试不同提示和了解模型行为非常有帮助。查看功能: 它们提供了一种直接的方式来查看特定模型的功能,无需任何设置。缺点:自动化有限: 它们专为手动使用而设计,使得将LLM的功能整合到你自己的软件应用程序中或自动化重复性任务变得困难或不可能。控制较少: 与使用API相比,你通常没有那么多选项来微调模型行为。温度或最大输出长度等设置可能受限或预设。潜在使用限制: 免费或试用界面通常对请求数量或可处理的文本量有限制。许多流行的大型语言模型都提供面向公众的聊天界面或“游乐场”,这些都是初学者的绝佳起点。应用程序编程接口(API):开发者的入口应用程序编程接口,简称API,充当一种中介,允许不同的软件程序相互通信。在LLM的使用场景中,API使你自己的应用程序(或脚本)能够以编程方式向LLM服务发送提示,并接收生成的文本。想象一下,如果你想构建一个写作助手应用程序,它使用LLM来建议句子补全。你不会为此使用网页界面;相反,你的应用程序会使用LLM的API。你的代码会将用户文本打包成一个API请求,发送到LLM服务指定的地址(通常称为端点),然后处理返回的响应。优点:整合能力: API专为整合而设计。你可以将LLM的能力直接整合到网站、移动应用、分析工具、自动化工作流程等等。自动化: 你可以编写脚本与API交互,从而自动处理大量文本或执行重复的提示任务。更强的控制: API通常会提供更多参数来控制LLM的生成过程,例如随机性(温度)、详细程度、停止条件等等。可扩展性: API访问通常被设计为能够处理比免费网页界面更高的请求量,通常基于按使用量付费的模式。缺点:需要编程: 使用API需要用Python、JavaScript或其他编程语言编写代码。需要设置: 你通常需要注册一个API密钥(用于识别你应用程序的唯一代码),并了解如何根据API文档构建请求。潜在成本: 尽管有些API提供免费套餐,但大量使用通常会根据处理的文本量或发出的请求数量产生费用。这里是这两种访问方法的简单示意图:digraph G { bgcolor="transparent"; rankdir=LR; node [shape=box, style=rounded, fontname="sans-serif", color="#495057", fontcolor="#495057"]; edge [color="#adb5bd"]; subgraph cluster_0 { label = "网页界面访问"; bgcolor="#e9ecef"; color="#ced4da"; fontcolor="#495057"; User [label="你", shape=circle, style=filled, fillcolor="#a5d8ff", color="#74c0fc"]; WebUI [label="网页浏览器\n(聊天界面 / 游乐场)", fillcolor="#ffec99", style=filled, color="#ffe066"]; User -> WebUI [label=" 输入提示 "]; WebUI -> LLM_Service [label=" 发送请求 "]; LLM_Service [label="LLM服务", shape=cylinder, style=filled, fillcolor="#bac8ff", color="#91a7ff"]; LLM_Service -> WebUI [label=" 发送响应 "]; WebUI -> User [label=" 显示结果 "]; } subgraph cluster_1 { label = "API访问"; bgcolor="#e9ecef"; color="#ced4da"; fontcolor="#495057"; App [label="你的应用程序\n(代码 / 脚本)", fillcolor="#b2f2bb", style=filled, color="#8ce99a"]; API [label="API请求\n(代码 + 提示 + 参数)", fillcolor="#ffd8a8", style=filled, color="#ffc078"]; API_Response [label="API响应\n(生成文本 + 数据)", fillcolor="#ffd8a8", style=filled, color="#ffc078"]; App -> API [label=" 构建请求 "]; API -> LLM_Service_API [label=" 发送请求 "]; LLM_Service_API [label="LLM服务", shape=cylinder, style=filled, fillcolor="#bac8ff", color="#91a7ff"]; LLM_Service_API -> API_Response [label=" 发送响应 "]; API_Response -> App [label=" 处理响应 "]; } }比较了互动流程:手动通过网页界面与编程方式通过API。选择合适的方法在以下情况使用网页界面: 你刚开始接触、想快速尝试提示、需要执行一次性任务,或没有编程经验。在以下情况使用API: 你需要将LLM功能整合到自己的软件中、自动化文本生成或处理任务、需要对输出进行更精细的控制,或计划大规模使用模型。了解这些访问方法很重要,这有助于你决定进一步了解哪些模型以及最终如何应用它们。虽然网页界面提供了即时满足感,但API能够构建由大型语言模型驱动的复杂应用程序。下一章将详细介绍使用预训练模型的实际步骤,涉及这两种互动方式。