趋近智

APX AI

在线

我可以读取您正在浏览的页面。随时向我提问！

趋近智

所有课程

大型语言模型应用高级向量检索

章节 1: 近似最近邻算法

重温向量嵌入与搜索基础

分层可导航小世界 (HNSW) 内部机制

倒排文件索引 (IVF) 变体

乘积量化 (PQ) 工作原理

其他基于图的近似最近邻（ANN）方法（例如，NSG，Vamana）

选择合适的近似最近邻算法：性能取舍

HNSW的实战操作：实现与调优

章节 2: 向量搜索性能与效率的优化

量化技术：标量量化与乘积量化

实现优化乘积量化 (OPQ)

二进制哈希与局部敏感哈希 (LSH) 回顾

高级过滤策略：预过滤与后过滤

将元数据与向量一同高效索引

硬件加速考量 (CPU SIMD, GPU)

内存管理与缓存策略

实践：应用量化与过滤

章节 3: 混合搜索方法

纯向量搜索的局限性

结合关键词搜索（BM25, TF-IDF）

结果合并与排序方法

倒数排序融合（RRF）及其他融合算法

基于图的向量搜索增强

多模态搜索的考量

动手实践：构建混合搜索流程

章节 4: 面向生产系统的向量搜索扩容

分布式向量数据库架构

向量索引的分片策略

复制与高可用性

负载均衡搜索查询

向量搜索性能指标监控

生产环境中索引的更新与维护

大规模部署的成本优化

实践：配置分布式系统

章节 5: 高级调优与评估

评估指标再审视：召回率、准确率、延迟

构建用于评估的真实标准数据集

参数敏感度分析 (HNSW, IVF)

搜索算法的 A/B 测试框架

调试搜索相关性问题

在线与离线评估方法

针对特定应用需求的调整（RAG 与语义搜索）

动手实践：全面性能评估

向量搜索扩容：生产策略

章节 4: 面向生产系统的向量搜索扩容

构建高效的向量 (vector)搜索索引并对本地查询进行优化是基础步骤。然而，将这些系统迁移到处理真实流量和海量数据集时，会带来独特的运维和架构挑战。当向量数量 $N$ 增长到数十亿规模，且查询吞吐量 (throughput) ( $QPS$ ) 需要保持高水平时，前面讨论的单节点方法将变得不足。

本章将着重介绍在生产规模下构建和管理能可靠、高效运行的向量搜索系统所需的策略和架构模式。你将了解到：

针对向量搜索设计分布式系统架构。
实现分片技术，以在多台机器上对大型索引进行分区。
通过复制确保高可用性和容错性。
使用负载均衡有效分配查询负载。
监控向量搜索系统的主要性能指标。
管理实时环境中的索引更新和维护。
考虑大型部署的成本影响和优化策略。

到本章结束时，你将理解构建能够支持严苛、大规模LLM应用的向量搜索方案所需的工程原理。

课程章节

4.1 分布式向量数据库架构
4.2 向量索引的分片策略
4.3 复制与高可用性
4.4 负载均衡搜索查询
4.5 向量搜索性能指标监控
4.6 生产环境中索引的更新与维护
4.7 大规模部署的成本优化
4.8 实践：配置分布式系统

© 2026 ApX Machine Learning