所有课程

大型语言模型的微调与调整

章节 1: 大型语言模型适应原理

回顾：预训练语言模型和Transformer

微调和适配的必要性

自然语言处理中的迁移学习方法

微调时的架构考量

微调方法概述

章节 2: 微调数据准备

指令微调原则

指令数据集的获取与构建

监督微调（SFT）的数据格式化

域适应数据要求

数据稀缺与不平衡的处理

文本数据扩充技术

实践：准备指令微调数据集

章节 3: 全参数微调

全参数微调的机制

设置训练循环

超参数调优策略

防止过拟合的正则化方法

计算资源管理

检查点保存与训练恢复

动手实践：全参数微调较小规模的LLM

章节 4: 参数高效微调 (PEFT) 方法

参数高效性的原理

低秩适配 (LoRA)

量化低秩适配 (QLoRA)

适配器模块

PEFT 方法比较

使用 Hugging Face PEFT 库进行实现

动手实践：使用 LoRA 进行微调

实操：使用QLoRA进行微调

章节 5: 高阶微调策略

多任务微调

顺序适应与持续学习

减轻灾难性遗忘

人类反馈强化学习 (RLHF) 介绍

奖励模型训练

使用 PPO 进行策略优化

高级适应中的挑战

章节 6: 微调模型的评估与分析

传统自然语言处理评估指标的局限性

评估指令遵循能力

评估事实准确性和幻觉

偏见与公平性评估方法

鲁棒性评估（对抗性攻击、分布外数据）

模型校准评估

定性分析与错误分类

人工评估规范

实践：分析模型输出中的错误

章节 7: 优化与部署考量

训练时的内存优化

使用分布式策略加速训练

微调后优化：量化

微调后优化：剪枝

合并 PEFT 适配器

模型序列化与打包

推理服务框架

生产环境中微调模型的监控

超参数调优策略

全新 · 开源

Kerb - 大语言模型开发工具包

用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。

这部分内容有帮助吗？

参考文献

Adam: A Method for Stochastic Optimization, Diederik P. Kingma and Jimmy Ba, 2015 3rd International Conference for Learning Representations DOI: 10.48550/arXiv.1412.6980 - 介绍了Adam优化器，该优化器被广泛用于训练和微调包括大型语言模型在内的深度学习模型。
Decoupled Weight Decay Regularization, Ilya Loshchilov, Frank Hutter, 2019 ICLR 2019 DOI: 10.48550/arXiv.1711.05101 - 介绍了AdamW，这是Adam的改进版本，它正确地应用了权重衰减，使其成为基于Transformer模型的优化器。
SGDR: Stochastic Gradient Descent with Warm Restarts, Ilya Loshchilov, Frank Hutter, 2017 ICLR 2017 DOI: 10.48550/arXiv.1608.03983 - 提出了余弦退火学习率调度策略，这是一种常用于提升模型训练和收敛的技术。
Random Search for Hyper-Parameter Optimization, James Bergstra and Yoshua Bengio, 2012 Journal of Machine Learning Research, Vol. 13 - 证明了随机搜索在超参数优化方面通常比网格搜索更有效。
Practical Bayesian Optimization of Machine Learning Algorithms, Jasper Snoek, Hugo Larochelle, and Ryan P. Adams, 2012 Advances in Neural Information Processing Systems DOI: 10.48550/arXiv.1206.2944 - 讨论了贝叶斯优化在超参数调整中的应用，提供了一种比网格搜索和随机搜索更系统的方法。

© 2025 ApX Machine Learning用心打造