所有课程

评估合成数据质量：高级方法

章节 1: 合成数据评估的基本原理

定义数据质量的维度

评估生成数据的挑战

保真度、实用性与隐私的权衡

评估指标分类体系

建立评估环境

章节 2: 进阶统计保真度评估

多变量分布比较

分布相似性的假设检验

相关性和协方差结构分析

信息论度量

倾向得分评估

动手实践：实现多变量检验

章节 3: 评估机器学习效用

合成数据训练-真实数据测试 (TSTR) 方法

训练-真实-测试-合成 (TRTS) 方法

比较下游模型性能指标

评估特征重要性一致性

超参数优化带来的影响

动手实践：运行TSTR评估

章节 4: 隐私评估方法

了解合成数据中的隐私风险

成员推断攻击 (MIAs)

属性推断攻击

基于距离的隐私度量

差分隐私考量（如适用）

实践操作：实现一个基本的成员推断攻击

章节 5: 专用和模型特定评估指标

评估合成图像：FID、IS、精确率、召回率

评估合成文本：困惑度、BLEU分数

评估合成时间序列数据

生成对抗网络（GAN）评估指标

VAE评估指标

动手操作：图像数据FID计算

章节 6: 构建全面的评估报告

为任务选择合适的衡量标准

自动化评估管线

有效地呈现评估结果

解读与沟通评估结果

比较不同合成数据集的性能

实践：生成质量报告片段

属性推断攻击

这部分内容有帮助吗？

参考文献

The Algorithmic Foundations of Differential Privacy, Cynthia Dwork, Aaron Roth, 2014 Foundations and Trends® in Theoretical Computer Science, Vol. 9 (Now Publishers Inc.) DOI: 10.1561/0400000042 - 关于差分隐私的权威著作，阐释了数据发布中抵御各种推断攻击的理论原理。

© 2025 ApX Machine Learning用心打造