所有课程

生产环境中RAG系统的优化

章节 1: 生产级RAG系统的核心构成

生产级RAG架构：扩容考量

识别RAG流程中的性能瓶颈

生产环境RAG评估的高级指标

RAG系统长期维护的难题

RAG生产部署的基础设施考量

RAG组件的版本控制与实验追踪

生产环境RAG系统中的安全考量

章节 2: 高级检索优化方法

嵌入模型的专业化微调

混合搜索：结合密集与稀疏检索器

提高相关性的高级重排架构

查询增强：扩展与改写

为各类数据源优化分块策略

高级文档表示方法：多向量与 ColBERT

整合知识图谱以优化检索

主动学习以改进检索器

实践：实施与评估进阶重排序

章节 3: 优化生成部分

针对RAG特定生成任务微调大语言模型

控制LLM输出：风格、语气和真实性

减轻RAG输出中的幻觉

生产RAG系统的高级提示工程

高效的大语言模型：蒸馏与量化

实施防护措施与内容安全

生成内容质量的生产评估

动手实践：为RAG任务微调较小的LLM

章节 4: 端到端 RAG 系统性能优化

分析与降低RAG系统延迟

提升 RAG 吞吐量以应对高峰负载

在 RAG 管道中实施缓存策略

异步处理和请求批处理

向量数据库优化：索引与分片

运用硬件加速于RAG

生产RAG系统的负载均衡与自动伸缩

实践：RAG 流水线的性能分析与延迟优化

章节 5: 生产RAG的成本优化

识别生产RAG中的成本要素

RAG的经济高效模型选择

减少 LLM Token 使用量的方法

优化数据摄取与存储成本

基础设施选择：RAG系统的无服务器与预置方案

实施使用限额和预算

成本异常监控与警报

实践：RAG应用示例的成本建模

章节 6: 生产环境下的高级评估与监控

进阶RAG评估框架 (RAGAS, ARES)

离线评估与在线评估方法

自动化评估流程

监控检索组件中的漂移

RAG 系统中 LLM 表现的监控

将用户反馈纳入RAG系统优化

RAG 优化的 A/B 测试方法

构建RAG系统健康仪表盘

动手实践：构建 RAG 监控仪表盘

章节 7: 可扩展性、可靠性和可维护性

RAG系统的高可用架构设计

在RAG中实现容错

管理知识库更新与刷新周期

多租户与多RAG实例管理

使用CI/CD流水线自动化RAG部署

RAG系统中的数据治理与血缘追溯

生产RAG问题的高级调试

RAG 系统的运行文档

实践：设计可扩展的RAG架构

实施防护措施与内容安全

这部分内容有帮助吗？

参考文献

Constitutional AI: Harmlessness from AI Feedback, Yuntao Bai, Saurav Kadavath, Sandipan Kundu, Amanda Askell, Jackson Kernion, Andy Jones, Anna Chen, Anna Goldie, Azalia Mirhoseini, et al., 2022 arXiv preprint DOI: 10.48550/arXiv.2212.08073 - 讨论了通过AI反馈使LLM与人类价值观和安全原则保持一致的方法。这是一种训练LLM在没有大量人工干预的情况下调节自身行为的方法，与LLM作为评估者的技术相关。
Holistic Evaluation of Language Models, Percy Liang, Rishi Bommasani, Tony Lee, Dimitris Tsipras, Dilara Soylu, Michihiro Yasunaga, Yian Zhang, Deepak Narayanan, Yuhuai Wu, Ananya Kumar, Benjamin Newman, Binhang Yuan, Bobby Yan, Ce Zhang, Christian Cosgrove, Christopher D. Manning, Christopher Ré, Diana Acosta-Navas, Drew F. Hudson, Eric Zelikman, Esin Durmus, Faisal Ladhak, Frieda Rong, Hongyu Ren, Huaxiu Yao, Jue Wang, Keshav Santhanam, Laurel Orr, Lucia Zheng, Mert Yuksekgonul, Mirac Suzgun, Nathan Kim, Neel Guha, Niladri Chatterji, Omar Khattab, Peter Henderson, Qian Huang, Ryan Chi, Sang Michael Xie, Shibani Santurkar, Surya Ganguli, Tatsunori Hashimoto, Thomas Icard, Tianyi Zhang, Vishrav Chaudhary, William Wang, Xuechen Li, Yifan Mai, Yuhui Zhang, Yuta Koreeda, 2023 Transactions on Machine Learning Research DOI: 10.48550/arXiv.2211.09110 - 提供了一个评估LLM的框架，涵盖安全、公平和稳健性等多个标准，为评估护栏所解决的整体可靠性和风险提供了背景。
Google Cloud Perspective API Documentation, Google Cloud, 2024 (Google Cloud) - 广泛使用的内容审核API的官方文档，该API使用机器学习模型检测各种有害或有毒内容类别，是输出护栏中基于模型的分类器的一个实例。

© 2025 ApX Machine Learning用心打造