所有课程

大语言模型微调入门

章节 1: 模型定制的根基

什么是微调？

预训练与微调的比较

何时进行微调：一个分析体系

微调策略概述

迁移学习在大型语言模型中的作用

配置开发环境

章节 2: 用于微调的数据准备

获取和选择高质量数据集

指令式与对话式数据格式

数据清洗和预处理技术

构建和组织定制数据集

用于微调的分词

动手实践：构建微调数据集

章节 3: 全参数微调

全参数微调的工作原理

全参数微调的架构考量

计算资源管理

配置训练参数及超参数

监控训练：损失与指标

保存和加载精调模型

实践：小型模型上的全参数微调

章节 4: 参数高效微调 (PEFT)

参数高效微调概述

低秩适应（LoRA）：原理与运作

使用PEFT库实现LoRA

量化及其对微调的影响 (QLoRA)

其他PEFT方法：概述

PEFT与完全微调的优劣对比

动手实践：使用 LoRA 进行微调

章节 5: 评估与部署

界定生成型任务的性能指标

定量评估：ROUGE、BLEU 和困惑度

定性评估：人工参与评估

构建评估流程

将适配器与基础模型合并的方法

为推理准备模型

实践：评估微调模型

全参数微调的架构考量

这部分内容有帮助吗？

参考文献

Attention Is All You Need, Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin, 2017 Advances in Neural Information Processing Systems DOI: 10.48550/arXiv.1706.03762 - 介绍了Transformer架构、多头注意力机制以及基础的编码器-解码器设计。
Mixtral of Experts, Albert Q. Jiang, Alexandre Sablayrolles, Antoine Roux, Arthur Mensch, Blanche Savary, Chris Bamford, Devendra Singh Chaplot, Diego de las Casas, Emma Bou Hanna, Florian Bressand, Gianna Lengyel, Guillaume Bour, Guillaume Lample, Lélio Renard Lavaud, Lucile Saulnier, Marie-Anne Lachaux, Pierre Stock, Sandeep Subramanian, Sophia Yang, Szymon Antoniak, Teven Le Scao, Théophile Gervet, Thibaut Lavril, Thomas Wang, Timothée Lacroix, William El Sayed, 2024 (arXiv) DOI: 10.48550/arXiv.2401.04088 - 介绍了Mixtral模型，这是一种专家混合（MoE）架构的示例，可实现大型模型的有效推理。

© 2025 ApX Machine Learning用心打造