检索增强生成 (RAG) 在许多大型语言模型应用中居于核心地位,但让RAG系统在生产环境中可靠、高效地运行面临着一些具体难题。本章将讨论数据整合与检索流程,重点在于扩展性和性能。您将学习有效处理各类文档的技术,选择和优化向量存储以应对高负载工作,以及实现精密的索引和搜索策略,包括混合搜索和结果重排序。我们还将介绍保持索引数据实时更新的方法。本章最后将通过一个实践练习,构建一个完整、优化过的RAG流程。