微调后的大型语言模型的表现,根本上取决于其在适应期间学习所用的数据。本章提供构建和格式化数据集的方法,这些数据集专为指令遵循和特定用途调整而设计。您将了解指令微调背后的原理,以及获取、创建和组织有效指令数据集的实用方法。我们将介绍监督式微调 (SFT) 所需的特定格式,并研究为特定用途调整模型时特有的数据考量。此外,我们还将讨论处理数据有限或不平衡情况的策略,并介绍文本数据增强方法,以提升微调效果。目标是使您掌握准备高质量数据的技能,以有效引导大型语言模型实现预期的行为和能力。