趋近智
实际数据集通常不完整。数据条目可能因数据收集过程中的错误、传输问题,或者仅仅是信息当时无法获取而缺失。这些空缺,通常表现为 NaN(非数字)、NULL 或其他占位符,会严重影响数据分析和机器学习模型的表现。许多算法在遇到缺失值时无法正常运行。
本章主要介绍处理这一常见问题的基本方法。您将学到:
我们将通过实际例子来说明这些方法,为准备更干净、更可靠的数据打下基础。
2.1 什么是缺失值?
2.2 检测缺失数据的方法
2.3 可视化缺失数据模式
2.4 策略一:删除行(行删除法)
2.5 策略二:删除列
2.6 策略三:基础值填充(均值/中位数/众数)
2.7 选择策略的考量
2.8 处理缺失数据:动手实践
© 2026 ApX Machine Learning用心打造