所有课程

大语言模型微调入门

章节 1: 模型定制的根基

什么是微调？

预训练与微调的比较

何时进行微调：一个分析体系

微调策略概述

迁移学习在大型语言模型中的作用

配置开发环境

章节 2: 用于微调的数据准备

获取和选择高质量数据集

指令式与对话式数据格式

数据清洗和预处理技术

构建和组织定制数据集

用于微调的分词

动手实践：构建微调数据集

章节 3: 全参数微调

全参数微调的工作原理

全参数微调的架构考量

计算资源管理

配置训练参数及超参数

监控训练：损失与指标

保存和加载精调模型

实践：小型模型上的全参数微调

章节 4: 参数高效微调 (PEFT)

参数高效微调概述

低秩适应（LoRA）：原理与运作

使用PEFT库实现LoRA

量化及其对微调的影响 (QLoRA)

其他PEFT方法：概述

PEFT与完全微调的优劣对比

动手实践：使用 LoRA 进行微调

章节 5: 评估与部署

界定生成型任务的性能指标

定量评估：ROUGE、BLEU 和困惑度

定性评估：人工参与评估

构建评估流程

将适配器与基础模型合并的方法

为推理准备模型

实践：评估微调模型

动手实践：构建微调数据集

全新 · 开源

Kerb - 大语言模型开发工具包

用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。

这部分内容有帮助吗？

参考文献

Hello Dolly: Democratizing Generative AI, The Databricks Team, 2023 Databricks Blog (Databricks) - 介绍了 databricks-dolly-15k 数据集、其创建方法及其在开源指令遵循大型语言模型中的作用。
The 🤗 Datasets Library Documentation, Hugging Face, 2024 Hugging Face Documentation - Hugging Face datasets 库的官方文档，涵盖数据加载、处理和管理，这对构建微调数据集至关重要。
Tokenization in 🤗 Transformers, Hugging Face, 2024 Hugging Face Documentation (Hugging Face) - Hugging Face transformers 库中令牌化的指南，解释了其在为大型语言模型准备文本数据方面的实际用法。
Finetuned Language Models Are Zero-Shot Learners, Jason Wei, Maarten Bosma, Vincent Y. Zhao, Kelvin Guu, Adams Wei Yu, Brian Lester, Nan Du, Andrew M. Dai, Quoc V. Le, 2021 arXiv (arXiv) DOI: 10.48550/arXiv.2109.01652 - 一篇关于指令微调的基础论文，展示了如何通过结构化任务进行微调，从而提高语言模型的泛化能力。

© 2025 ApX Machine Learning用心打造