趋近智
在构建模型或得出确定性结论之前,了解数据是必要前提。
本章将介绍数据初步分析(EDA),它是一种系统化的方法,用于检查、概括和可视化数据集,以获得初步信息。
你将首先定义EDA,并了解其在数据分析流程中的主要目的。我们将概述进行EDA的结构化工作流程,并介绍常用的Python核心库,包括Pandas、NumPy、Matplotlib和Seaborn。最后,我们将指导你设置必要的软件环境,以便跟随后续章节中的实际例子。本章结束时,你将掌握EDA的“为什么”和“是什么”,并准备好开始分析数据的工具。
1.1 什么是数据初步分析?
1.2 EDA的目标
1.3 数据初步分析流程
1.4 EDA 的工具:Python 库简介
1.5 设置您的环境