在了解了大规模 RAG 系统的各个组件后,下一步便是在生产环境中高效地部署和管理它们。本章将讲解如何使你的 RAG 解决方案能够投入实际运行。你将学习如何使用 Airflow 或 Kubeflow 等工具实现工作流编排,并将 RAG 组件作为由 Kubernetes 管理的微服务进行部署。我们还将讨论 MLOps 实践,包括建立 CI/CD 流水线、全面的监控以及 A/B 测试框架。最后,我们将讨论优化基于云的 RAG 部署运行成本的方案。