大语言模型(LLM)在理解和生成类人文本方面表现出出色的能力。然而,它们的知识通常在训练时即已固定,这可能导致它们对快速变化的信息或训练数据中未包含的主题产生不准确的回应。它们有时还会生成听起来有说服力但与事实不符的回复,这通常被称为“幻觉”。检索增强生成技术(RAG)提供了一种解决这些局限性的方法。它的工作原理是:在生成步骤之前,加入一个信息检索步骤。大语言模型不再仅仅依靠其内部学习的参数,而是获得从外部知识源获取的相关上下文,以此来指导其回复。本章介绍RAG的基本原理。我们将讲解:标准大语言模型面临的RAG旨在解决的具体难题。检索增强生成技术的明确定义及其运行流程。核心架构组成部分:检索器和生成器。RAG与微调作为适应大语言模型的方法有何不同。在需要最新或专业知识的应用中使用RAG的核心优点。到本章结束时,您将明白RAG的目的及其基本结构,这将为后续详细说明其组成部分和实现方法的章节打下基础。