生成合成数据是很重要的一步,但其效用取决于数据质量以及其与LLM工作流程的配合程度。本章讨论了评估和问题解决的重要阶段。你将学会系统地评估你生成的合成数据,并应对常见的运行中遇到的问题。本章将涉及:量化分析的方法,使用特定指标,比如困惑度(表示为$PPL$)或多样性分数(如$D_s$)。定性审查的技巧,以确保内容连贯且相关。识别并减少你生成的数据集中的偏见的方法。管理事实准确性的方式,并减少模型生成不准确内容的情况。理解模型性能下降(有时称为模型崩溃)的原因,以及如何应对。确保你的合成数据具备原创性和多样性的技术。制定一个实用的验证核对表,用于指导你的评估流程。在本章结束时,你将有能力不仅生成合成数据,还能批判性地评估其是否符合预期用途,并处理其应用中可能出现的问题。