所有课程

数据科学导论

章节 1: 数据科学入门

数据科学的定义

数据科学的重要性

数据科学家的职责

必备技能概览

数据科学常用工具

第 1 章测验

章节 2: 认识数据基本知识

什么是数据？

结构化数据与非结构化数据

定量数据与定性数据

常见数据格式

理解数据属性和特征

元数据简介

第 2 章测验

章节 3: 数据科学流程

数据科学工作流程概述

明确问题或疑问

数据获取方法

数据准备概述

理解探索性数据分析

模型构建原理介绍

第 3 章测验

章节 4: 数据收集与准备

识别数据来源

数据清洗简介

处理缺失值

识别潜在异常值

基本数据转换需求

动手实践：简单数据加载

第 4 章测验

章节 5: 进行基本数据分析

开始数据初步分析 (EDA)

计算汇总统计量

测量数据分散度

理解频率分布

区分相关性与因果关系

假设基本原理介绍

动手实践：计算基本统计量

第 5 章测验

章节 6: 数据可视化概览

数据可视化的目的

常见图表类型说明

选择合适的图表

有效可视化的原则

可视化工具概览

动手实践：制作基本图表

第 6 章测验

导入数据

这部分内容有帮助吗？

参考文献

Python for Data Analysis: Data Wrangling with pandas, NumPy, and IPython, 3rd Edition, Wes McKinney, 2022 (O'Reilly Media) - 由 pandas 创始人撰写的实用指南，涵盖数据导入和处理。
R for Data Science (2nd Edition, in progress), Hadley Wickham, Garrett Grolemund, and Mine Çetinkaya-Rundel, 2023 - 一个在线资源，解释了如何使用 R 中的 Tidyverse 进行数据导入和转换。
I/O tools (text, CSV, HDF5, ...), The pandas development team, 2023 - pandas 用于读取和写入各种格式数据的官方指南。
readr: Read Rectangular Text Data, Hadley Wickham, Jim Hester, and Lionel Henry, 2023 - readr 包的文档，它简化了将数据导入 R 的过程。

© 2025 ApX Machine Learning用心打造