章节 3: 管理上下文和令牌

写出好用的提示后，下一个实际步骤是管理它们的大小。大型语言模型没有无限的记忆；它们在一个固定大小的输入范围内工作，这个范围被称为“上下文 (context)窗口”。发送超出此限制的提示会导致错误，而低效地使用可用空间会增加延迟和运行成本。API费用与令牌数量直接相关，通常遵循以下模型： $Cost = (Price_{input} \times Tokens_{input}) + (Price_{output} \times Tokens_{output})$ 。

本章着重介绍管理这一基本限制的工具和方法。您将学习：