趋近智
大师班
先修课程 编程与深度学习
级别:
大语言模型架构设计
实现并定制用于大规模语言建模的基于Transformer的架构。
大语言模型数据管理
建立用于获取、清洗和管理适用于大语言模型预训练的海量文本数据集的流程。
分布式训练实现
配置并运行使用各种并行策略和框架的大语言模型分布式训练任务。
模型训练与优化
应用高级优化技术、学习率调度和专用于大语言模型训练的正则化方法。
大语言模型评估技术
使用内部指标和下游任务基准评估模型性能。
推理优化
实现模型压缩和高效推理服务的方法。
本课程没有先修课程。
目前没有推荐的后续课程。
登录以撰写评论
分享您的反馈以帮助其他学习者。