所有课程

检索增强生成 (RAG) 入门

章节 1: 检索增强生成技术简介

标准大型语言模型的局限性

什么是检索增强生成（RAG）？

RAG系统的核心架构

RAG 对比微调：理解其差异

使用RAG的优势

第 1 章测验

章节 2: 检索组件

检索器在 RAG 中的作用

向量嵌入简介

常用嵌入模型

相似性搜索：查找相关向量

向量数据库简介

选择向量数据库：考量因素

实践：生成文本嵌入

第 2 章测验

章节 3: 准备检索所需数据

从不同来源加载文档

文档分块的必要性

固定大小分块策略

内容感知的分块方法

数据块的元数据关联

将处理后的数据存储到向量数据库中

动手实践：文档分块

第 3 章测验

章节 4: 生成模块与增强

生成器（LLM）在RAG中的作用

RAG提示词的结构化

上下文注入方法

管理上下文长度限制

生成最终回复

生成内容中的来源归属

第 4 章测验

章节 5: 搭建一个基本RAG流程

RAG 框架概述 (例如 LangChain、LlamaIndex)

实现检索器

实现生成器集成

结合检索与生成

在流程中执行查询

动手实践：端到端RAG系统

第 5 章测验

章节 6: RAG系统的评估与改进

评估RAG的挑战

组件层面的评估：检索

组件级别评估：生成

端到端RAG评估框架

常见故障模式

改进的基本策略

实践：分析RAG输出质量

第 6 章测验

什么是检索增强生成（RAG）？

这部分内容有帮助吗？

参考文献

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, Patrick Lewis, Yuxiang Wu, Punit Singh Koura, Sebastian Riedel, Edward Grefenstette, Ludovic Denoyer, and Mike Lewis, 2020 Advances in Neural Information Processing Systems (NeurIPS) 33, Vol. 33 (NeurIPS) DOI: 10.48550/arXiv.2005.11401 - 介绍RAG框架的原创论文，展示了其在知识密集型任务中结合检索与生成的有效性。
A Survey on Retrieval-Augmented Generation, Yunfan Gao, Yun Xiong, Xinyu Gao, Kang Zhang, Jiajun Zhang, HUI SUN, and Haizhou Wang, 2023 arXiv preprint arXiv:2312.10997 - 对RAG的全面综述，涵盖其基本组成部分、各种架构、应用及当前研究方向。
Retrieval Augmented Generation: Building the Next Generation of LLM Applications, Lewis Tunstall, Omar Espejel, and Philipp Schmid, 2023 (Hugging Face Blog) - 对RAG及其组成部分和实际优势的易懂解释，适合一般的技术读者。

© 2025 ApX Machine Learning用心打造