所有课程

大语言模型微调入门

章节 1: 模型定制的根基

什么是微调？

预训练与微调的比较

何时进行微调：一个分析体系

微调策略概述

迁移学习在大型语言模型中的作用

配置开发环境

章节 2: 用于微调的数据准备

获取和选择高质量数据集

指令式与对话式数据格式

数据清洗和预处理技术

构建和组织定制数据集

用于微调的分词

动手实践：构建微调数据集

章节 3: 全参数微调

全参数微调的工作原理

全参数微调的架构考量

计算资源管理

配置训练参数及超参数

监控训练：损失与指标

保存和加载精调模型

实践：小型模型上的全参数微调

章节 4: 参数高效微调 (PEFT)

参数高效微调概述

低秩适应（LoRA）：原理与运作

使用PEFT库实现LoRA

量化及其对微调的影响 (QLoRA)

其他PEFT方法：概述

PEFT与完全微调的优劣对比

动手实践：使用 LoRA 进行微调

章节 5: 评估与部署

界定生成型任务的性能指标

定量评估：ROUGE、BLEU 和困惑度

定性评估：人工参与评估

构建评估流程

将适配器与基础模型合并的方法

为推理准备模型

实践：评估微调模型

迁移学习在大型语言模型中的作用

这部分内容有帮助吗？

参考文献

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova, 2019 Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), Vol. 1 DOI: 10.48550/arXiv.1810.04805 - 这篇基础论文介绍了 BERT 模型，它推广了预训练和微调范式，展示了迁移学习在自然语言处理中的效率和性能提升。
A Survey of Large Language Models, Wayne Xin Zhao, Kun Zhou, Junyi Li, Tianyi Tang, Xiaolei Wang, Yupeng Hou, Yingqian Min, Beichen Zhang, Junjie Zhang, Zican Dong, Yifan Du, Chen Yang, Yushuo Chen, Zhipeng Chen, Jinhao Jiang, Ruiyang Ren, Yifan Li, Xinyu Tang, Zikang Liu, Peiyu Liu, Jian-Yun Nie, Ji-Rong Wen, 2023 DOI: 10.48550/arXiv.2303.18223 - 一份近期且全面的调查，提供了大型语言模型的广泛概述，包括它们的预训练、微调以及迁移学习的基本原理。

© 2025 ApX Machine Learning用心打造