趋近智
第一章介绍了评估合成数据的主要维度。统计保真度,衡量合成数据的统计特性与真实数据之间的贴近程度,是一个基本方面。虽然比较针对单个特征的基本统计量,例如均值 (μ) 或标准差 (σ),能提供一个起点,但它通常无法捕捉真实数据集中存在的复杂高维关联。简单地匹配每个特征 Xi 的边际分布 P(Xi) 并不能保证联合分布 P(X1,X2,...,Pn) 得到准确的体现。
本章侧重于用于更全面统计保真度评估的进阶方法。您将学习如何:
本章最后包含一个实践环节,您会在此环节使用 Python 库实现多个多变量统计检验。
2.1 多变量分布比较
2.2 分布相似性的假设检验
2.3 相关性和协方差结构分析
2.4 信息论度量
2.5 倾向得分评估
2.6 动手实践:实现多变量检验
© 2026 ApX Machine Learning用心打造