趋近智
大师班
15.1 动机:为什么要进行分布式训练?
15.2 数据并行 (DP)
15.3 张量并行 (TP)
15.4 流水线并行 (PP)
15.5 混合并行策略 (DP+TP, DP+PP等)
15.6 通信开销分析
© 2025 ApX Machine Learning