Outlier Detection: A Survey, Varun Chandola, Arindam Banerjee, and Vipin Kumar, 2009ACM Computing Surveys, Vol. 41 (Association for Computing Machinery (ACM))DOI: 10.1145/1541880.1541882 - 一篇被广泛引用的调查论文,提供了关于异常值检测方法的全面概述和分类,包括统计、基于邻近度和基于模型的方法。
Data Cleaning, Ihab F. Ilyas, Xu Chu, 2019 Vol. 28 (Association for Computing Machinery and Morgan & Claypool Publishers)DOI: 10.1145/3342502 - 一本学术书籍,系统地阐述了现代数据清洗的挑战和技术,涵盖了各种数据质量问题及其解决方案。