趋近智
首页
博客
课程
大模型
中
所有课程
数据清洗与预处理入门
章节 1: 干净数据的重要性
什么是数据清洗?
什么是数据预处理?
常见数据质量问题来源
数据质量差的影响
数据清洗流程概述
章节 2: 识别和处理缺失数据
什么是缺失值?
检测缺失数据的方法
可视化缺失数据模式
策略一:删除行(行删除法)
策略二:删除列
策略三:基础值填充(均值/中位数/众数)
选择策略的考量
处理缺失数据:动手实践
章节 3: 处理重复数据
如何定义重复数据?
为何移除重复数据?
识别完全重复行
根据特定列识别重复项
移除重复行
处理重复数据:实践
章节 4: 修正数据类型
数据集中的常见数据类型
为什么正确的数据类型很重要
识别不正确的数据类型
转换为数字类型 (整数, 浮点数)
处理数值转换中的错误
转换为日期时间类型
转换为分类或字符串类型
数据类型修正:动手实践
章节 5: 数据格式化与标准化
统一格式的重要性
统一文本大小写(大写/小写)
去除前导/尾随空格
简单字符串替换
基本单位转换示例
格式化实操
格式化实操
这部分内容有帮助吗?
有帮助
报告问题
标记为完成
© 2025 ApX Machine Learning
实操基本数据格式化