趋近智

所有课程

评估合成数据质量：高级方法

章节 1: 合成数据评估的基本原理

定义数据质量的维度

评估生成数据的挑战

保真度、实用性与隐私的权衡

评估指标分类体系

建立评估环境

章节 2: 进阶统计保真度评估

多变量分布比较

分布相似性的假设检验

相关性和协方差结构分析

信息论度量

倾向得分评估

动手实践：实现多变量检验

章节 3: 评估机器学习效用

合成数据训练-真实数据测试 (TSTR) 方法

训练-真实-测试-合成 (TRTS) 方法

比较下游模型性能指标

评估特征重要性一致性

超参数优化带来的影响

动手实践：运行TSTR评估

章节 4: 隐私评估方法

了解合成数据中的隐私风险

成员推断攻击 (MIAs)

属性推断攻击

基于距离的隐私度量

差分隐私考量（如适用）

实践操作：实现一个基本的成员推断攻击

章节 5: 专用和模型特定评估指标

评估合成图像：FID、IS、精确率、召回率

评估合成文本：困惑度、BLEU分数

评估合成时间序列数据

生成对抗网络（GAN）评估指标

VAE评估指标

动手操作：图像数据FID计算

章节 6: 构建全面的评估报告

为任务选择合适的衡量标准

自动化评估管线

有效地呈现评估结果

解读与沟通评估结果

比较不同合成数据集的性能

实践：生成质量报告片段

评估合成数据的机器学习效用

章节 3: 评估机器学习效用

在评估了真实数据集与合成数据集之间的统计相似性后，我们将转向一个重要的实际问题：合成数据在训练实际机器学习 (machine learning)模型方面有多大用处？本章侧重于量化 (quantization)这种机器学习效用。

你将学习标准的评估方法，主要是训练-合成-测试-真实 (TSTR) 方法。在TSTR中，模型仅使用合成数据进行训练，然后在一个留存的真实数据集上进行评估。我们还将考察补充性的训练-真实-测试-合成 (TRTS) 方法。

主要涵盖的技术有：

比较真实数据训练的模型与合成数据训练的模型之间的标准性能指标（如准确率、F1分数或AUC）。
分析合成数据训练的模型是否能学到与真实数据训练的模型相似的特征重要性模式。
理解使用合成数据可能如何影响超参数 (parameter) (hyperparameter)调优的结果。

目标是提供客观的衡量标准，以确定合成数据是否能有效地替代真实数据在你的下游机器学习应用中。这包括动手实践这些评估流程。

课程章节

3.1 合成数据训练-真实数据测试 (TSTR) 方法
3.2 训练-真实-测试-合成 (TRTS) 方法
3.3 比较下游模型性能指标
3.4 评估特征重要性一致性
3.5 超参数优化带来的影响
3.6 动手实践：运行TSTR评估

© 2026 ApX Machine Learning