趋近智

APX AI

在线

我可以读取您正在浏览的页面。随时向我提问！

趋近智

所有课程

大语言模型微调入门

章节 1: 模型定制的根基

什么是微调？

预训练与微调的比较

何时进行微调：一个分析体系

微调策略概述

迁移学习在大型语言模型中的作用

配置开发环境

章节 2: 用于微调的数据准备

获取和选择高质量数据集

指令式与对话式数据格式

数据清洗和预处理技术

构建和组织定制数据集

用于微调的分词

动手实践：构建微调数据集

章节 3: 全参数微调

全参数微调的工作原理

全参数微调的架构考量

计算资源管理

配置训练参数及超参数

监控训练：损失与指标

保存和加载精调模型

实践：小型模型上的全参数微调

章节 4: 参数高效微调 (PEFT)

参数高效微调概述

低秩适应（LoRA）：原理与运作

使用PEFT库实现LoRA

量化及其对微调的影响 (QLoRA)

其他PEFT方法：概述

PEFT与完全微调的优劣对比

动手实践：使用 LoRA 进行微调

章节 5: 评估与部署

界定生成型任务的性能指标

定量评估：ROUGE、BLEU 和困惑度

定性评估：人工参与评估

构建评估流程

将适配器与基础模型合并的方法

为推理准备模型

实践：评估微调模型

章节 2: 用于微调的数据准备

模型表现，很大程度上取决于其训练数据的质量。在您通过微调 (fine-tuning)改变模型表现之前，必须先收集一个能清晰且统一体现期望能力的数据集。本章将系统地指导您如何准备高质量数据，从而让大型语言模型具备特定能力。

您将学习创建可供模型使用的数据集的完整流程。我们会讲到：

数据获取与结构化： 寻找合适的公开或私有数据，并将其组织成指令遵循或对话对 $(x, y)$ 等有效格式的方法。
数据清洗与预处理： 移除噪声、处理不一致性、以及文本标准化的实用技术，以提升训练稳定性和最终模型表现。
分词 (tokenization)： 将文本转换为模型所需数字格式的过程，包括处理特殊词元 (token)、填充和截断的策略。

本章最后包含一个实践练习，您将运用这些技术，将原始文本数据处理成一个结构化、已分词的、可用于微调的数据集。

课程章节

2.1 获取和选择高质量数据集
2.2 指令式与对话式数据格式
2.3 数据清洗和预处理技术
2.4 构建和组织定制数据集
2.5 用于微调的分词
2.6 动手实践：构建微调数据集

© 2026 ApX Machine Learning