趋近智
大型语言模型通常无法获取特定、私有或非常新的信息。检索增强生成 (RAG) 提供了一种方法,通过将模型的响应基于外部数据源来解决这一局限。这种技术将大型语言模型的生成能力与信息检索机制结合起来。
在本章中,您将学习RAG背后的基本原理。我们将介绍如何整合LangChain和LlamaIndex等工具来构建RAG系统。您将了解向量 (vector)存储和嵌入 (embedding),它们对高效信息检索非常重要。我们将逐步讲解构建一个基本RAG流程的步骤,并讨论评估其表现的方法。到本章结束时,您将能够使用Python实现一个简单的RAG应用。
7.1 检索增强生成原理
7.2 将 LlamaIndex/LangChain 整合用于 RAG
7.3 向量数据库和嵌入技术概述
7.4 搭建一个基础向量库
7.5 构建 RAG 流程
7.6 评估 RAG 性能指标
7.7 实践:构建一个简单的RAG应用