趋近智
所有课程
6.1 大型模型训练中的挑战概述
6.2 JAX 生态系统库(Flax, Haiku)简介
6.3 模型参数和状态的处理
6.4 将 pmap 与训练框架结合使用
6.5 梯度累积
6.6 梯度检查点(再物化)
6.7 混合精度训练
6.8 模型并行策略
6.9 大规模优化算法
6.10 实践:实现梯度检查点
© 2025 ApX Machine Learning