在构建模型或得出确定性结论之前,了解数据是必要前提。本章将介绍数据初步分析(EDA),它是一种系统化的方法,用于检查、概括和可视化数据集,以获得初步信息。你将首先定义EDA,并了解其在数据分析流程中的主要目的。我们将概述进行EDA的结构化工作流程,并介绍常用的Python核心库,包括Pandas、NumPy、Matplotlib和Seaborn。最后,我们将指导你设置必要的软件环境,以便跟随后续章节中的实际例子。本章结束时,你将掌握EDA的“为什么”和“是什么”,并准备好开始分析数据的工具。