趋近智

APX AI

在线

我可以读取您正在浏览的页面。随时向我提问！

趋近智

所有课程

检索增强生成 (RAG) 入门

章节 1: 检索增强生成技术简介

标准大型语言模型的局限性

什么是检索增强生成（RAG）？

RAG系统的核心架构

RAG 对比微调：理解其差异

使用RAG的优势

第 1 章测验

章节 2: 检索组件

检索器在 RAG 中的作用

向量嵌入简介

常用嵌入模型

相似性搜索：查找相关向量

向量数据库简介

选择向量数据库：考量因素

实践：生成文本嵌入

第 2 章测验

章节 3: 准备检索所需数据

从不同来源加载文档

文档分块的必要性

固定大小分块策略

内容感知的分块方法

数据块的元数据关联

将处理后的数据存储到向量数据库中

动手实践：文档分块

第 3 章测验

章节 4: 生成模块与增强

生成器（LLM）在RAG中的作用

RAG提示词的结构化

上下文注入方法

管理上下文长度限制

生成最终回复

生成内容中的来源归属

第 4 章测验

章节 5: 搭建一个基本RAG流程

RAG 框架概述 (例如 LangChain、LlamaIndex)

实现检索器

实现生成器集成

结合检索与生成

在流程中执行查询

动手实践：端到端RAG系统

第 5 章测验

章节 6: RAG系统的评估与改进

评估RAG的挑战

组件层面的评估：检索

组件级别评估：生成

端到端RAG评估框架

常见故障模式

改进的基本策略

实践：分析RAG输出质量

第 6 章测验

章节 1: 检索增强生成技术简介

大语言模型（LLM）在理解和生成类人文本方面表现出出色的能力。然而，它们的知识通常在训练时即已固定，这可能导致它们对快速变化的信息或训练数据中未包含的主题产生不准确的回应。它们有时还会生成听起来有说服力但与事实不符的回复，这通常被称为“幻觉 (hallucination)”。

检索增强生成 (RAG)技术（RAG）提供了一种解决这些局限性的方法。它的工作原理是：在生成步骤之前，加入一个信息检索步骤。大语言模型不再仅仅依靠其内部学习的参数 (parameter)，而是获得从外部知识源获取的相关上下文 (context)，以此来指导其回复。

本章介绍RAG的基本原理。我们将讲解：

标准大语言模型面临的RAG旨在解决的具体难题。
检索增强生成技术的明确定义及其运行流程。
核心架构组成部分：检索器和生成器。
RAG与微调 (fine-tuning)作为适应大语言模型的方法有何不同。
在需要最新或专业知识的应用中使用RAG的核心优点。

到本章结束时，您将明白RAG的目的及其基本结构，这将为后续详细说明其组成部分和实现方法的章节打下基础。

课程章节

1.1 标准大型语言模型的局限性
1.2 什么是检索增强生成（RAG）？
1.3 RAG系统的核心架构
1.4 RAG 对比微调：理解其差异
1.5 使用RAG的优势

© 2026 ApX Machine Learning