趋近智
首页
博客
课程
大模型
中
所有课程
数据概览分析入门
章节 1: 数据初步分析的原理
什么是数据初步分析?
EDA的目标
数据初步分析流程
EDA 的工具:Python 库简介
设置您的环境
章节 2: 数据加载、检查与初步清理
从多种来源加载数据(CSV、Excel、JSON)
数据初步观察:形状、头部、尾部
理解数据类型(dtypes)
处理缺失数据:识别
缺失数据的处理策略:填充与删除
检测和处理重复记录
动手实践:数据加载与初步整理
章节 3: 单变量分析:理解单个变量
分析数值变量:集中趋势
数值变量分析:离散程度
数值变量可视化:直方图
数值变量的可视化:箱线图
分析分类变量:频数统计
可视化分类变量:柱状图
使用统计方法识别异常值
练习:单变量数据分析
章节 4: 双变量分析:考察变量间的关系
数值变量与数值变量:散点图
数值变量与数值变量:相关性分析
相关性可视化:热力图
数值型与分类型:比较图表
分类变量与分类变量:交叉制表
分类变量间的可视化:堆叠条形图与分组条形图
动手实践:双变量分析
章节 5: 高级数据可视化与特征工程入门
多元数据可视化:对图
自定义图表以提高清晰度(标题、标签、图例)
特征工程思想介绍
从现有特征生成新特征
基本数据转换:缩放与归一化
处理分类特征:编码方法
降维思路介绍
汇总和报告EDA结果
实践操作:特征创建与归纳