将检索增强生成(RAG)系统从实验环境部署到实际生产环境,需要周密的规划和可靠的工程实践。本章为构建RAG系统提供初步准备,使其在面对实际运行需求时,不仅功能完善,而且高性能、可伸缩、易于维护。我们将研究对有效扩展RAG系统有重要作用的架构组成部分。您将学会识别可能影响响应速度和效率的常见性能瓶颈。讨论随后将转向为评估生产环境RAG系统而定制的高级指标,这些指标能提供比基本准确性衡量更具体的认识。本章也为您应对RAG系统长期维护的持续挑战做好准备。这包括做出必要的基础设施选择,理解模型和数据版本控制的意义,实施有效的实验跟踪,以及设立基本的安全措施以保护您的部署。理解这些核心要点将有助于您理解后续章节中详述的高级优化技术。