趋近智
大师班
16.1 分布式训练库概述
16.2 DeepSpeed 介绍
16.3 使用 DeepSpeed ZeRO 优化
16.4 Megatron-LM 介绍
16.5 配置 Megatron-LM 中的张量和流水线并行
16.6 结合框架与策略
© 2025 ApX Machine Learning