前几章介绍了评估合成数据质量的通用指标,这些指标侧重于统计保真度和机器学习实用性,适用于多种场景。然而,合成数据生成通常针对特定数据形式(如图像或时间序列),或采用不同的生成模型架构(例如GAN或VAE),每种情况都面临独特的评估难题。通用指标可能无法捕捉与这些特定环境相关的特定属性或失效模式。本章将介绍如何应对对定制化评估技术的需求。你将学习专门为以下方面设计的评估指标:图像数据: 理解并应用诸如 Fréchet 起始距离 (FID) 和 起始分数 (IS) 等度量标准,以评估生成图像的质量和多样性。文本数据: 使用自然语言处理中常用的指标,例如困惑度(Perplexity)和BLEU分数,来评估合成文本。时间序列数据: 评估时间依赖性、自相关性以及其他动态特性保留情况的方法。特定生成模型: 研究常与GAN相关的指标(例如与判别器性能相关的)和VAE相关的指标(例如重建损失、潜在空间的属性)。在本章结束时,你将能够选择并应用合适的专用指标,以更好地了解针对特定应用或由特定模型类型生成的合成数据质量。