所有课程

机器学习的概率与统计要点

章节 1: 概率基本原理回顾

样本空间与事件回顾

条件概率与独立性

贝叶斯定理讲解

随机变量概述

期望值与方差

概率原理在 Python 中的应用

第 1 章测验

章节 2: 常用概率分布

伯努利分布和二项分布

正态（高斯）分布

数据建模中的性质与应用

在 SciPy 中使用分布

动手实践：模拟与绘制分布

第 2 章测验

章节 3: 数据集的描述性统计

集中趋势的度量：均值、中位数、众数

离散度量：方差、标准差、极差

理解偏度和峰度

百分位数和四分位数

相关性分析

区分相关性与因果关系

数据总结的可视化

使用 Pandas 计算描述性统计量

实践：总结数据集

第 3 章测验

章节 4: 推断统计：抽样与估计

总体和样本

抽样方法概述

中心极限定理

理解点估计

置信区间说明

计算均值的置信区间

动手实践：抽样模拟与区间估计

第 4 章测验

章节 5: 模型评估的假设检验

制定零假设与备择假设

理解第一类和第二类错误

卡方检验介绍

方差分析 (ANOVA) 概述

使用 Python 进行假设检验

实践：将T检验应用于样本数据

第 5 章测验

章节 6: 回归分析简介

简单线性回归模型

最小二乘估计法

解读回归系数

模型评估指标 (R平方, 均方误差)

线性回归的假设

多元线性回归概述

使用Python构建回归模型

动手实践：拟合与评估线性模型

第 6 章测验

抽样方法概述

这部分内容有帮助吗？

参考文献

Sampling: Design and Analysis, Sharon L. Lohr, 2021 (CRC Press) DOI: 10.1201/9780429298899 - 一本内容全面的教科书，涵盖了各种概率抽样设计的理论和实践方面，包括简单随机抽样、分层抽样、系统抽样和聚类抽样。
Statistics, David Freedman, Robert Pisani, and Roger Purves, 2007 (W. W. Norton & Company) - 清晰直观地介绍了基本的统计概念，并深入涵盖了抽样原理、抽样误差以及代表性样本的重要性。
User Guide - Cross-validation: evaluating estimator performance, scikit-learn developers, 2023 - 官方文档，阐释了抽样，特别是分层抽样，在机器学习中数据拆分和交叉验证中的应用，以确保模型评估的可靠性。
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, Aurélien Géron, 2022 (O'Reilly Media) - 一份实践指南，其中包含数据拆分策略的讨论，例如分类问题的分层抽样，及其在准备机器学习模型数据集中的作用。

© 2025 ApX Machine Learning用心打造