趋近智

APX AI

在线

我可以读取您正在浏览的页面。随时向我提问！

趋近智

所有课程

大规模分布式检索增强生成

章节 1: 可扩展RAG架构核心要素

RAG核心组件的审视

识别 RAG 扩展中的瓶颈和局限

分布式系统原则在RAG中的应用

分布式RAG系统的架构模式

大规模RAG系统评估指标

高可用性与容错性设计

分布式RAG中的数据一致性模型

章节 2: 高级分布式检索策略

规模化向量搜索：分片、复制与索引

分布式稠密检索：实现与优化

大规模混合检索：整合密集与稀疏检索器

分布式环境中的图检索

多向量与ColBERT式架构应对大规模应用

分布式配置中的进阶重排管线

大规模数据摄取的近实时索引

动手实践：实现分片向量索引

章节 3: 优化分布式RAG中的大语言模型

高效LLM服务架构

领域专用RAG的参数高效微调

LLM部署的量化与剪枝技术

处理大规模检索数据集时的长上下文

大规模减少幻觉的策略

多LLM RAG架构与智能路由

动手实践：为特定任务RAG微调LLM

章节 4: 规模化数据摄入与处理管道

分布式数据摄取框架

可伸缩文档分块与预处理方法

分布式嵌入生成与管理

变更数据捕获用于实时RAG更新

规模化向量数据库管理与优化

分布式RAG系统中的数据治理与血缘

动手实践: 构建可伸缩数据摄取管道

章节 5: 大规模 RAG 的编排与运行

使用 Airflow 或 Kubeflow 进行工作流编排

RAG 组件的微服务设计模式

RAG 部署的容器化与 Kubernetes 应用

分布式RAG系统的高级监控、日志记录与告警

RAG 系统的 CI/CD 流水线

RAG系统的A/B测试和实验框架

云端RAG的成本优化策略

动手实践：在Kubernetes上部署RAG并进行监控

章节 6: 高级 RAG 架构与技术

多跳与迭代式RAG的规模化应用

代理型RAG系统与分布式工具应用

分布式环境中知识图谱增强型RAG

自校正和自提升的RAG系统

处理高动态和流式数据源

大规模RAG部署中的安全考量

规模化跨语言与多模态RAG

实践：设计多阶段RAG系统

章节 7: 分布式RAG的性能调优与基准测试

找出RAG组件中的性能瓶颈

延迟与吞吐量优化技术

RAG 组件的负载均衡策略

不同系统层的缓存机制

分布式RAG的基准测试：指标与工具

RAG 系统的压力测试与容量规划

分布式环境中的性能分析与调试

实践：优化分布式RAG系统以达到最佳性能

适用于RAG的可伸缩数据管道 | 摄入与处理

章节 4: 规模化数据摄入与处理管道

检索增强生成 (RAG)系统，尤其是在大规模应用中，依赖于有效管理的数据。系统可用的信息，其准确性和及时性是系统输出的根本。本章介绍如何构建和运行数据管道，以满足大规模分布式RAG部署对数据量和速度的要求。

您将学习如何：

构建使用Spark或Kafka等分布式框架的高吞吐量 (throughput)数据摄入系统。
采用有效的文档分块和预处理策略，以适应大规模数据集。
处理嵌入 (embedding)生成及其在分布式环境中的管理。
运用变更数据捕获（CDC）技术，确保您的RAG系统能以最小延迟反映数据更新。
管理和优化向量 (vector)数据库，以支持广泛的RAG操作。
建立数据治理实践，并维护这些多方面系统中的数据血缘。

本章包含一个动手实践部分，您将在本部分构建一个可伸缩的数据摄入管道，以巩固所讨论的原理。

课程章节

4.1 分布式数据摄取框架
4.2 可伸缩文档分块与预处理方法
4.3 分布式嵌入生成与管理
4.4 变更数据捕获用于实时RAG更新
4.5 规模化向量数据库管理与优化
4.6 分布式RAG系统中的数据治理与血缘
4.7 动手实践: 构建可伸缩数据摄取管道

© 2026 ApX Machine Learning