数据很少以可以直接分析的格式出现。在从中得到有用的信息之前,您首先需要获取数据并进行准备。本章着重介绍数据科学工作流程中的这些重要的第一步。您将学习从常见来源查找和获取数据的实用的方法。我们将介绍数据清洗的重要理念,包括处理缺失值等常见问题的策略,以及识别被称为异常值的特殊数据点。此外,我们还将涉及使数据保持一致并可供分析工具使用的基本数据转换。本章包含一个实用的练习,以巩固加载和查看数据集的相关理念。