趋近智
构建高效的向量 (vector)搜索索引并对本地查询进行优化是基础步骤。然而,将这些系统迁移到处理真实流量和海量数据集时,会带来独特的运维和架构挑战。当向量数量 增长到数十亿规模,且查询吞吐量 (throughput) () 需要保持高水平时,前面讨论的单节点方法将变得不足。
本章将着重介绍在生产规模下构建和管理能可靠、高效运行的向量搜索系统所需的策略和架构模式。你将了解到:
到本章结束时,你将理解构建能够支持严苛、大规模LLM应用的向量搜索方案所需的工程原理。
4.1 分布式向量数据库架构
4.2 向量索引的分片策略
4.3 复制与高可用性
4.4 负载均衡搜索查询
4.5 向量搜索性能指标监控
4.6 生产环境中索引的更新与维护
4.7 大规模部署的成本优化
4.8 实践:配置分布式系统