趋近智
先修课程 Python、机器学习与云计算基础
级别:
分布式训练系统
设计并实现分布式训练任务,运用数据并行、模型并行和流水线并行,借助DeepSpeed和PyTorch FSDP等框架。
机器学习高级Kubernetes应用
在Kubernetes上编排复杂的机器学习工作负载,运用高级调度功能,针对GPU、抢占式实例和多租户环境。
推理优化
架构并部署高吞吐量、低延迟的推理服务,运用模型编译、量化和专用服务框架。
可扩展数据系统
构建可扩展的特征存储和数据处理管道,用于实时和批处理计算。
AI财务运营
实施成本管理、归因和优化策略,专为AI和机器学习云支出设计。
生产级MLOps管道
构建自动化、端到端的MLOps管道,包含CI/CD、数据版本控制和模型监控。
本课程没有先修课程。
目前没有推荐的后续课程。
登录以撰写评论
分享您的反馈以帮助其他学习者。