趋近智
在计算了保真度、实用性和隐私等各方面的一系列指标后,原始数据可能令人难以理解。一个满是分数的表格可能包含所有信息,但它很少能以易于理解的方式呈现全貌。有效的可视化将这些数值结果转化为清晰、易于解读的见解,从而更容易理解合成数据的优点和不足,并将这些发现传达给相关方。目标不仅是呈现数据,更是指导解读并支持关于合成数据是否符合预期用途的明智决策。
第一步是为你想说明的特定指标或比较选择适当的图表类型。不同的可视化方式擅长突出数据的不同侧面。
比较分布是保真度评估的根本。虽然单变量比较直接,但可视化多变量关系需要更多关注。
并排或叠加的直方图/密度图能够立刻显示单个特征在形状、中心和离散度上的差异。
叠加密度直方图,比较真实数据集和合成数据集中‘年龄’特征的分布。
热力图提供了一种直观的方式来比较相关矩阵。将真实数据的热力图放在合成数据的热力图旁边,使用相同的颜色刻度。模式差异能够立刻突出合成数据未能捕获依赖关系的地方。
并排热力图,可视化真实数据和合成数据的相关矩阵。一致的颜色刻度允许直接比较依赖结构。
机器学习实用性指标通常涉及比较在不同数据源上训练的模型性能。
条形图在比较使用不同训练方案(TSTR、TRTR、TRTS)获得的性能指标(KPI),如准确率、F1分数或 AUC 时很有效。表示置信区间或多次运行的标准差的误差棒增加了统计背景。
比较两种不同模型在训练-真实/测试-真实(基线)、训练-合成/测试-真实(TSTR 实用性)和训练-真实/测试-合成(TRTS 保真度)场景下的 AUC 分数。
比较特征重要性排名有助于评估在合成数据上训练的模型是否学习到与真实数据上训练的模型相似的模式。并排水平条形图可以有效地呈现这种比较。
并排水平条形图,比较在合成数据与真实数据上训练的模型所得的特征重要性分数。
隐私评估通常涉及从攻击模拟中得出的指标。
MIA 分类器的性能通常使用 ROC 曲线或精确度-召回率曲线来呈现。曲线下面积 (AUC) 提供了一个单一的汇总统计量,通常使用条形图与 0.5 的基线(随机猜测)进行比较。
ROC 曲线展示了成员推断攻击分类器在真阳性率和假阳性率之间的权衡。对角虚线表示随机猜测。
最近记录距离 (DCR) 等指标可以使用直方图或密度图进行可视化,比较真实记录与合成记录到训练数据中最近邻的最小距离分布。合成记录的距离更小可能表明潜在的隐私泄露。
通常,单一可视化不足够。将多个图表组合成一个连贯的报告或仪表板可以提供全面的视图。
对于比较多个合成数据集或生成方法在多个标准化指标(例如,保真度分数、实用性分数、隐私分数)上的表现,雷达图提供了一种紧凑的视觉摘要。但是,要确保坐标轴清晰标注,并避免绘制过多的数据集或指标,这可能会使图表难以阅读。
雷达图比较了两种合成数据生成模型(模型 A 和模型 B)在五个标准化质量指标上的表现。面积越大通常表示在这些轴上性能越好。
通过认真选择、设计和呈现可视化,您可以将复杂的评估结果转化为有说服力的证据,有效地传达合成数据的质量和适用性。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造