合成数据训练-真实数据测试 (TSTR) 方法

这部分内容有帮助吗？

参考文献

Synthetic datasets for statistical disclosure control: Theory and implementation, Jörg Drechsler, 2011 Vol. Lecture Notes in Statistics 201 (Springer-Verlag New York Inc.) DOI: 10.1007/978-1-4419-7419-1 - 一本关于隐私保护合成数据的著作，包含评估数据用于分析任务的方法。
Evaluating the quality of synthetic data generated by deep learning models: a comprehensive survey, Damien Biau, Romain Tavenard, Rémi Flamary, 2023 Artificial Intelligence Review, Vol. 56 (Springer US) DOI: 10.1007/s10462-023-10515-w - 一项近期调查，涵盖合成数据质量评估的多个方面，包括TSTR等实用性指标。
Measuring data utility for privacy-preserving synthetic data, Yang Zhao, Weijie Sun, Ji-Won Kim, Jiexin Yu, Liqiang Wang, 2022 Journal of Biomedical Informatics, Vol. 133 (Elsevier) DOI: 10.1016/j.jbi.2022.104164 - 本文介绍了评估合成数据分析价值的方法，尤其是在隐私保护背景下。
Modeling Tabular Data using Conditional GANs, Lei Xu, Kalyan Veeramachaneni, 2019 Advances in Neural Information Processing Systems, Vol. 32 (Neural Information Processing Systems Foundation, Inc.) DOI: 10.55919/neurips-2019-1412 - 介绍了CTGAN，并通过机器学习任务展示了合成数据质量的评估，这与TSTR方法一致。