所有课程

机器学习的概率与统计要点

章节 1: 概率基本原理回顾

样本空间与事件回顾

条件概率与独立性

贝叶斯定理讲解

随机变量概述

期望值与方差

概率原理在 Python 中的应用

第 1 章测验

章节 2: 常用概率分布

伯努利分布和二项分布

正态（高斯）分布

数据建模中的性质与应用

在 SciPy 中使用分布

动手实践：模拟与绘制分布

第 2 章测验

章节 3: 数据集的描述性统计

集中趋势的度量：均值、中位数、众数

离散度量：方差、标准差、极差

理解偏度和峰度

百分位数和四分位数

相关性分析

区分相关性与因果关系

数据总结的可视化

使用 Pandas 计算描述性统计量

实践：总结数据集

第 3 章测验

章节 4: 推断统计：抽样与估计

总体和样本

抽样方法概述

中心极限定理

理解点估计

置信区间说明

计算均值的置信区间

动手实践：抽样模拟与区间估计

第 4 章测验

章节 5: 模型评估的假设检验

制定零假设与备择假设

理解第一类和第二类错误

卡方检验介绍

方差分析 (ANOVA) 概述

使用 Python 进行假设检验

实践：将T检验应用于样本数据

第 5 章测验

章节 6: 回归分析简介

简单线性回归模型

最小二乘估计法

解读回归系数

模型评估指标 (R平方, 均方误差)

线性回归的假设

多元线性回归概述

使用Python构建回归模型

动手实践：拟合与评估线性模型

第 6 章测验

使用 Pandas 计算描述性统计量

这部分内容有帮助吗？

参考文献

Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, Peter Bruce, Andrew Bruce, and Peter Gedeck, 2020 (O'Reilly Media) - 以实践方法讲解与数据科学相关的统计概念，包括对描述性统计及其应用的审阅。
Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, Wes McKinney, 2022 (O'Reilly Media) - 使用 Pandas 的权威资源，涵盖 Python 中的数据结构、处理和统计方法。

© 2025 ApX Machine Learning用心打造