趋近智
检索增强生成(RAG)有效处理标准大型语言模型(LLM)的限制,例如知识截止和幻觉 (hallucination)问题。RAG系统旨在利用外部知识库,其基本结构由两个主要的职能部分组成,它们协同工作。
可以把它想象成一个两步过程:首先,找到相关信息,然后使用这些信息生成答案。这种职责分离使得每个部分都能专注于自己的功能,并有效地为最终输出做出贡献。
检索器: 这是RAG系统的信息检索引擎。它的主要目的是接收用户的输入查询,并从预定义的外部知识来源中查找最相关的信息片段(常被称为“文档”或“块”)。这个来源可以是文本文件、PDF、数据库条目、网页或其他结构化或非结构化数据的集合。检索器不理解语言生成的细节;它只专注于基于与查询的语义相似性进行高效准确的信息查找。我们将在第2章详细研究检索技术,特别是涉及向量 (vector)嵌入 (embedding)和向量数据库的技术。
生成器: 这个部分通常是一个标准的大型语言模型(LLM)。它的职责是接收原始用户查询以及由第一个部分检索到的相关上下文 (context),然后合成一个连贯的、类似人类的答案。通过接收与查询一同获取的上下文,大型语言模型被“增强”了,它能够获取到在其原始训练数据中可能不存在的特定、相关且可能最新的信息。这使得它能够根据提供的文档生成更具事实依据并针对特定查询定制的回复。整合此上下文并生成最终输出的过程将在第4章介绍。
这两个部分通过一个明确定义的工作流程彼此作用,通常由一个编排器或框架来协调(我们将在后续章节中提及)。
典型RAG架构中的数据流。用户查询启动从知识来源的检索,检索到的上下文增强了生成器大型语言模型的输入。
这种模块化架构有其重要性。它使得开发者能够:
理解这个核心架构,以及专业检索器与强大生成器之间基于外部知识来源的彼此作用,对于构建和理解RAG系统来说是根本的。接下来的章节将更详细地分析这个结构的每个部分。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•