在介绍了 LoRA、QLoRA 和其他参数高效微调(PEFT)技术的实现细节之后,下一步是评估它们的有效性并了解它们之间的权衡。本章侧重于定量和定性评估这些微调方法。我们将考察适用于 PEFT 的标准性能指标,进行与完整微调的基准比较,分析模型的稳定性和泛化能力,研究潜在的灾难性遗忘,提供计算成本的详细分析,并讨论与这些技术相关的当前局限性以及未解决的研究问题。理解这些评估维度对于在具体场景中选择和部署 PEFT 策略做出明智的决定是必要的。