所有课程

高级贝叶斯机器学习

章节 1: 重审贝叶斯根本

概率建模原理

贝叶斯定理在高维空间中

先验选择中的主观性与客观性

信息论与贝叶斯推断的关联：熵与KL散度

贝叶斯推断中的计算难题

高级模型检查与评估

章节 2: 马尔可夫链蒙特卡洛方法

蒙特卡罗积分的原理

马尔可夫链理论之于MCMC

Metropolis-Hastings 算法变体

基于条件结构的吉布斯采样

哈密顿蒙特卡洛（HMC）机制

无U形转弯采样器 (NUTS)

诊断MCMC收敛性和性能

动手实践：实现高级MCMC

章节 3: 变分推断方法

优化即推断：变分推断的观点

推导证据下界 (ELBO)

平均场近似具体内容

坐标上升变分推断 (CAVI)

随机变分推断 (SVI) 针对大规模数据

黑箱变分推断 (BBVI)

进阶变分族

MCMC与VI优势比较

动手实践：可扩展变分推断

章节 4: 高斯过程

贝叶斯非参数建模介绍

定义高斯过程：函数的先验分布

协方差函数（核）：性质与选择

高斯过程回归公式

超参数边际似然优化

高斯过程分类方法

高斯过程的可扩展近似方法

动手实践：高斯过程建模

章节 5: 概率图模型进阶内容

贝叶斯网络：结构学习

贝叶斯网络中的参数学习

概率图模型中的高级推断：联结树算法

大型概率图模型中的近似推断

隐狄利克雷分配 (LDA)：贝叶斯表述

LDA 的推断：折叠吉布斯采样

LDA的推断：变分贝叶斯

动手实践：使用LDA进行主题建模

章节 6: 贝叶斯深度学习

贝叶斯深度学习的缘由

贝叶斯神经网络（BNNs）：权重的先验分布

贝叶斯神经网络的推断挑战

用于贝叶斯神经网络的MCMC方法（例如，随机梯度哈密顿蒙特卡洛）

BNN的变分推断（例如：反向传播贝叶斯）

BNN中的不确定性估计

变分自编码器 (VAEs) 作为概率模型

将 Dropout 视为近似贝叶斯推断

BNN的实际训练与评估

动手实践：构建贝叶斯神经网络

信息论与贝叶斯推断的关联：熵与KL散度

这部分内容有帮助吗？

参考文献

Elements of Information Theory, Thomas M. Cover and Joy A. Thomas, 2006 (Wiley-Interscience) DOI: 10.1002/047174882X - 信息论的经典教材，详细介绍了熵和KL散度。
Information Theory, Inference, and Learning Algorithms, David J. C. MacKay, 2003 (Cambridge University Press) - 将信息论、贝叶斯推断和学习算法联系起来的参考资料。
Pattern Recognition and Machine Learning, Christopher M. Bishop, 2006 (Springer) - 广受认可的机器学习教材，其中包含关于贝叶斯方法、信息论和变分推断的精彩部分。
Variational Inference: A Review for Statisticians, David M. Blei, Alp Kucukelbir, Jon D. McAuliffe, 2017 Journal of the American Statistical Association, Vol. 112 (Taylor & Francis) DOI: 10.1080/01621459.2017.1285773 - 一篇评论文章，概述了变分推断，这是KL散度在贝叶斯机器学习中的一个重要应用。

© 2025 ApX Machine Learning用心打造