趋近智
所有课程
先修课程 PyTorch高级应用,分布式基础知识
级别:
FSDP架构
利用ZeRO阶段对参数、梯度和优化器状态进行分区,设计扩展方案。
内存优化
实现激活检查点和CPU卸载,以最大化每GPU的吞吐量。
多节点网络
配置并调整NCCL通信,以实现高效的跨节点扩展。
性能分析
分析通信与计算重叠,并解决内存碎片问题。
本课程没有先修课程。
目前没有推荐的后续课程。
登录以撰写评论
分享您的反馈以帮助其他学习者。
© 2025 ApX Machine Learning用心打造