Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela, 2020Advances in Neural Information Processing Systems, Vol. 33 (Curran Associates, Inc.)DOI: 10.55919/neurips.2020.00994 - 这篇基础性论文介绍了检索增强生成(RAG)范式,强调了从知识库中检索相关信息以改进语言模型响应的重要性。它支持了对准备充分的源数据的需求,其中上下文元数据可以增强检索效果。
Nodes, Documents, and Metadata, LlamaIndex Documentation, 2024 (LlamaIndex) - 这篇来自流行RAG框架的概念指南解释了文本如何被组织成节点(块),以及如何将重要的元数据与这些节点关联起来,以便进行有效的索引和检索,提供了实用的实施见解。