所有课程

数据科学导论

章节 1: 数据科学入门

数据科学的定义

数据科学的重要性

数据科学家的职责

必备技能概览

数据科学常用工具

第 1 章测验

章节 2: 认识数据基本知识

什么是数据？

结构化数据与非结构化数据

定量数据与定性数据

常见数据格式

理解数据属性和特征

元数据简介

第 2 章测验

章节 3: 数据科学流程

数据科学工作流程概述

明确问题或疑问

数据获取方法

数据准备概述

理解探索性数据分析

模型构建原理介绍

第 3 章测验

章节 4: 数据收集与准备

识别数据来源

数据清洗简介

处理缺失值

识别潜在异常值

基本数据转换需求

动手实践：简单数据加载

第 4 章测验

章节 5: 进行基本数据分析

开始数据初步分析 (EDA)

计算汇总统计量

测量数据分散度

理解频率分布

区分相关性与因果关系

假设基本原理介绍

动手实践：计算基本统计量

第 5 章测验

章节 6: 数据可视化概览

数据可视化的目的

常见图表类型说明

选择合适的图表

有效可视化的原则

可视化工具概览

动手实践：制作基本图表

第 6 章测验

数据清洗简介

这部分内容有帮助吗？

参考文献

Data Quality: Concepts, Methodologies and Techniques, Carlo Batini, Monica Scannapieco, 2016 (Springer) DOI: 10.1007/978-3-319-27514-6 - 本书为理解数据质量问题以及数据质量管理和改进的各种方法论提供了全面的学术基础。
Python for Data Analysis: Data Wrangling with pandas, NumPy, and IPython, Wes McKinney, 2022 (O'Reilly Media) - 这本实用指南虽然使用Python，但有效地阐述了常见的数据清理挑战及其通用解决方案，对于理解数据准备的概念很有价值。

© 2025 ApX Machine Learning用心打造