构建在小型数据集上表现良好的检索增强生成(RAG)系统是一个已知问题。然而,将这些系统迁移到处理大规模生产环境会带来一系列独特的挑战。本章将提供构建RAG系统所需的知识,使系统不仅有效,而且可扩展,并能在高负载下可靠运行。您将首先从大型系统设计的角度回顾RAG核心组件,找出阻碍系统扩展性的常见瓶颈。接着,我们将研究分布式系统的基本原则如何直接应用于RAG架构。这包括研究为分布式RAG量身定制的多种架构模式,定义评估其在大规模环境下表现的合适度量指标,并理解高可用性、容错性和数据一致性的设计考量。通过学习这些内容,您将对如何着手设计旨在应对高要求、实际操作场景的RAG系统建立扎实的理解。