趋近智
大型语言模型拥有广泛的通用知识,但这些知识通常在模型训练时就已固定。它们无法获取实时信息、公司内部文件或在训练结束后才产生的特定数据集。这种局限性限制了它们在需要当前或专有背景信息的应用中的有效性。
本章介绍检索增强生成 (RAG),这是一种旨在解决此问题的方法。RAG 使大型语言模型能够动态地获取并使用外部信息。模型无需完全依赖其内部参数,而是可以将相关检索到的数据整合到生成过程中。
您将学到 RAG 系统的核心组成部分和工作流程。我们将介绍:
到本章结束时,您将了解如何将大型语言模型与外部知识来源连接起来,大幅扩展它们在特定文档问答或获取最新信息等任务中的适用性。
6.1 标准大语言模型知识的局限
6.2 检索增强生成 (RAG) 简介
6.3 文档加载与拆分
6.4 文本嵌入模型
6.5 向量存储简介
6.6 实施语义搜索/检索
6.7 结合检索到的内容与提示词
6.8 RAG 基本流程的实现
6.9 实操:构建文档RAG问答系统
© 2026 ApX Machine Learning用心打造