在分析开始前,数据必须成功载入,并且其基本属性要被了解。本章侧重于数据分析过程中这些最初的实用步骤。你将学习如何运用Pandas库,从CSV、Excel和JSON等常见文件类型中读取数据到DataFrame中。数据加载完成后,我们将介绍初步检查的方法:查看数据形态,预览前几行和后几行,以及审视与每列关联的数据类型($dtypes$)。此外,本章会介绍基本的数据清理方法。你将学习如何识别缺失数据点(通常表示为$NaN$),并研究处理它们的常用策略,例如填充或删除。我们也会处理在你数据集中的重复记录的检测与管理。完成本章学习后,你将能够加载数据集,并进行必要的初步检查和清理操作。