趋近智
机器学习模型高度依赖于其训练数据的质量。通常,您会遇到的数据集在被算法有效使用之前,需要大量的准备工作。实际数据通常是不完整、不一致的,或者格式不适合处理。
本章介绍数据预处理的基本技术。您将学习以下实用方法:
学完本章后,您将明白为什么这些步骤是必需的,以及如何执行基本的数据清洗和转换任务,为机器学习模型准备数据。
6.1 数据预处理的重要性
6.2 处理缺失值
6.3 特征缩放介绍
6.4 编码分类特征
6.5 再次谈谈:将数据划分为训练集和测试集
6.6 动手实践:基本数据清洗步骤
© 2026 ApX Machine Learning用心打造