趋近智
前几章介绍了评估合成数据质量的通用指标,这些指标侧重于统计保真度和机器学习 (machine learning)实用性,适用于多种场景。然而,合成数据生成通常针对特定数据形式(如图像或时间序列),或采用不同的生成模型架构(例如GAN或VAE),每种情况都面临独特的评估难题。通用指标可能无法捕捉与这些特定环境相关的特定属性或失效模式。
本章将介绍如何应对对定制化评估技术的需求。你将学习专门为以下方面设计的评估指标:
在本章结束时,你将能够选择并应用合适的专用指标,以更好地了解针对特定应用或由特定模型类型生成的合成数据质量。
5.1 评估合成图像:FID、IS、精确率、召回率
5.2 评估合成文本:困惑度、BLEU分数
5.3 评估合成时间序列数据
5.4 生成对抗网络(GAN)评估指标
5.5 VAE评估指标
5.6 动手操作:图像数据FID计算
© 2026 ApX Machine Learning用心打造