检索增强生成(RAG)是许多大型语言模型应用的核心,但在生产环境中让RAG系统可靠高效运行会带来一些具体难题。本章讨论数据整合与检索流程,侧重于可扩展性和性能。你将学习有效处理多种文档类型的方法,如何选择和优化向量存储以应对高负荷工作量,以及如何实施复杂的索引和搜索策略,包括混合搜索和结果重排序。我们还将介绍保持索引数据最新状态的方法。本章最后将通过一项实践练习,构建一个完整且优化的RAG流程。