所有课程

大语言模型微调入门

章节 1: 模型定制的根基

什么是微调？

预训练与微调的比较

何时进行微调：一个分析体系

微调策略概述

迁移学习在大型语言模型中的作用

配置开发环境

章节 2: 用于微调的数据准备

获取和选择高质量数据集

指令式与对话式数据格式

数据清洗和预处理技术

构建和组织定制数据集

用于微调的分词

动手实践：构建微调数据集

章节 3: 全参数微调

全参数微调的工作原理

全参数微调的架构考量

计算资源管理

配置训练参数及超参数

监控训练：损失与指标

保存和加载精调模型

实践：小型模型上的全参数微调

章节 4: 参数高效微调 (PEFT)

参数高效微调概述

低秩适应（LoRA）：原理与运作

使用PEFT库实现LoRA

量化及其对微调的影响 (QLoRA)

其他PEFT方法：概述

PEFT与完全微调的优劣对比

动手实践：使用 LoRA 进行微调

章节 5: 评估与部署

界定生成型任务的性能指标

定量评估：ROUGE、BLEU 和困惑度

定性评估：人工参与评估

构建评估流程

将适配器与基础模型合并的方法

为推理准备模型

实践：评估微调模型

全参数微调的工作原理

这部分内容有帮助吗？

参考文献

Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 一本全面的教材，涵盖了神经网络、反向传播、损失函数和优化器等基础概念，对于理解微调机制至关重要。
Adam: A Method for Stochastic Optimization, Diederik P. Kingma and Jimmy Ba, 2015 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.1412.6980 - 介绍了自适应矩估计 (Adam) 优化器，这是本节讨论的 AdamW 优化器的基础算法。
Decoupled Weight Decay Regularization, Ilya Loshchilov and Frank Hutter, 2019 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.1711.05101 - 提出了 AdamW，Adam 的增强版，它将权重衰减与自适应学习率解耦，有助于有效训练大型模型。
CS224n: Natural Language Processing with Deep Learning - Course Materials, Stanford University, 2023 (Stanford University) - 提供关于用于NLP的深度学习基础的优质课程材料，包括反向传播、优化器和与LLM微调相关的训练循环。

© 2025 ApX Machine Learning用心打造