所有课程

检索增强生成 (RAG) 入门

章节 1: 检索增强生成技术简介

标准大型语言模型的局限性

什么是检索增强生成（RAG）？

RAG系统的核心架构

RAG 对比微调：理解其差异

使用RAG的优势

第 1 章测验

章节 2: 检索组件

检索器在 RAG 中的作用

向量嵌入简介

常用嵌入模型

相似性搜索：查找相关向量

向量数据库简介

选择向量数据库：考量因素

实践：生成文本嵌入

第 2 章测验

章节 3: 准备检索所需数据

从不同来源加载文档

文档分块的必要性

固定大小分块策略

内容感知的分块方法

数据块的元数据关联

将处理后的数据存储到向量数据库中

动手实践：文档分块

第 3 章测验

章节 4: 生成模块与增强

生成器（LLM）在RAG中的作用

RAG提示词的结构化

上下文注入方法

管理上下文长度限制

生成最终回复

生成内容中的来源归属

第 4 章测验

章节 5: 搭建一个基本RAG流程

RAG 框架概述 (例如 LangChain、LlamaIndex)

实现检索器

实现生成器集成

结合检索与生成

在流程中执行查询

动手实践：端到端RAG系统

第 5 章测验

章节 6: RAG系统的评估与改进

评估RAG的挑战

组件层面的评估：检索

组件级别评估：生成

端到端RAG评估框架

常见故障模式

改进的基本策略

实践：分析RAG输出质量

第 6 章测验

实现检索器

这部分内容有帮助吗？

参考文献

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela, 2020 Advances in Neural Information Processing Systems 33 (NeurIPS 2020), Vol. 33 (Curran Associates, Inc.) DOI: 10.48550/arXiv.2005.11401 - 阐述了最初的检索增强生成（RAG）框架，详细介绍了其架构以及将外部知识融入语言模型的优势。
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks, Nils Reimers and Iryna Gurevych, 2019 Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP) (Association for Computational Linguistics) DOI: 10.18653/v1/D19-1410 - 介绍了Sentence-BERT模型，它能高效生成高质量的句子嵌入，是检索器中使用的sentence-transformers等库的基础。
ChromaDB Documentation, Chroma, 2024 - Chroma官方指南，一个开源嵌入数据库。它提供了安装、客户端使用、集合管理和查询的细节，与检索器的实现相关。
Sentence-Transformers Documentation, Nils Reimers, Iryna Gurevych, 2024 - sentence-transformers Python库的官方指南，详细介绍了如何加载预训练模型和生成句子嵌入，对将查询转换为向量至关重要。

© 2025 ApX Machine Learning用心打造