趋近智
生成合成数据通常旨在保护原始数据集中个体的隐私。然而,仅仅生成数据是不够的;我们必须严格评估实际保留了多少隐私。如果不这样做,可能导致重构敏感信息或识别原始数据中个体等风险。
本章侧重于量化这些隐私风险的实用方法。您将学到:
在本章结束时,您将能够实施并理解若干主要方法,用于衡量您的合成数据集的隐私特点。
4.1 了解合成数据中的隐私风险
4.2 成员推断攻击 (MIAs)
4.3 属性推断攻击
4.4 基于距离的隐私度量
4.5 差分隐私考量(如适用)
4.6 实践操作:实现一个基本的成员推断攻击
© 2026 ApX Machine Learning用心打造