所有课程

高级贝叶斯机器学习

章节 1: 重审贝叶斯根本

概率建模原理

贝叶斯定理在高维空间中

先验选择中的主观性与客观性

信息论与贝叶斯推断的关联：熵与KL散度

贝叶斯推断中的计算难题

高级模型检查与评估

章节 2: 马尔可夫链蒙特卡洛方法

蒙特卡罗积分的原理

马尔可夫链理论之于MCMC

Metropolis-Hastings 算法变体

基于条件结构的吉布斯采样

哈密顿蒙特卡洛（HMC）机制

无U形转弯采样器 (NUTS)

诊断MCMC收敛性和性能

动手实践：实现高级MCMC

章节 3: 变分推断方法

优化即推断：变分推断的观点

推导证据下界 (ELBO)

平均场近似具体内容

坐标上升变分推断 (CAVI)

随机变分推断 (SVI) 针对大规模数据

黑箱变分推断 (BBVI)

进阶变分族

MCMC与VI优势比较

动手实践：可扩展变分推断

章节 4: 高斯过程

贝叶斯非参数建模介绍

定义高斯过程：函数的先验分布

协方差函数（核）：性质与选择

高斯过程回归公式

超参数边际似然优化

高斯过程分类方法

高斯过程的可扩展近似方法

动手实践：高斯过程建模

章节 5: 概率图模型进阶内容

贝叶斯网络：结构学习

贝叶斯网络中的参数学习

概率图模型中的高级推断：联结树算法

大型概率图模型中的近似推断

隐狄利克雷分配 (LDA)：贝叶斯表述

LDA 的推断：折叠吉布斯采样

LDA的推断：变分贝叶斯

动手实践：使用LDA进行主题建模

章节 6: 贝叶斯深度学习

贝叶斯深度学习的缘由

贝叶斯神经网络（BNNs）：权重的先验分布

贝叶斯神经网络的推断挑战

用于贝叶斯神经网络的MCMC方法（例如，随机梯度哈密顿蒙特卡洛）

BNN的变分推断（例如：反向传播贝叶斯）

BNN中的不确定性估计

变分自编码器 (VAEs) 作为概率模型

将 Dropout 视为近似贝叶斯推断

BNN的实际训练与评估

动手实践：构建贝叶斯神经网络

LDA的推断：变分贝叶斯

这部分内容有帮助吗？

参考文献

Latent Dirichlet Allocation, David M. Blei, Andrew Y. Ng, Michael I. Jordan, 2003 Journal of Machine Learning Research, Vol. 3 (MIT Press) DOI: 10.1162/jmlr.2003.3.blei03a - 介绍了潜在狄利克雷分配（LDA）模型及其基础的变分贝叶斯推断算法，包括平均场近似和坐标上升更新。
Variational Inference: A Review for Statisticians, David M. Blei, Alp Kucukelbir, Jon D. McAuliffe, 2017 Journal of the American Statistical Association, Vol. 112 (Taylor & Francis on behalf of the American Statistical Association) DOI: 10.1080/01621459.2017.1285773 - 对变分推断进行了全面且现代的综述，详细阐述了理论基础、平均场近似、ELBO最大化及其与包括LDA在内的各种模型的关联。
Stochastic Variational Inference, Matthew D. Hoffman, David M. Blei, Chong Wang, John Paisley, 2013 Journal of Machine Learning Research, Vol. 14 DOI: 10.5555/2503926.2503947 - 介绍了随机变分推断（SVI）算法，该算法通过使用小批量数据将变分贝叶斯扩展到大规模数据集，与本节中关于扩展性的讨论相关。
Pattern Recognition and Machine Learning, Christopher M. Bishop, 2006 (Springer) - 第10章对变分推断进行了清晰且基础的介绍，包括其理论基础、平均场近似及其在各种概率模型中的应用。

© 2025 ApX Machine Learning用心打造