趋近智
在高维空间 (high-dimensional space)中查找查询向量 (vector)的精确最近邻点,这在使用大型语言模型(LLM)的嵌入 (embedding)时很常见,但其扩展性较差。采用精确 -NN 在数百万甚至数十亿向量中匹配最接近点,这对于诸多应用而言,计算耗费巨大,难以执行。
近似最近邻(ANN)算法通过舍弃完全精确度,换取搜索速度的极大提高,从而提供了实用方案。
本章将主要讲解几种广泛应用的ANN技术的核心运作方式,它们对于创建高效的向量搜索系统非常必要。我们将考察分层可导航小世界(HNSW)、倒排文件索引(IVF)的不同形式以及乘积量化 (quantization)(PQ)的构建与查询过程。我们还将介绍其他图结构方法,并探讨在选择合适算法时,如何根据构建时间、内存占用和查询表现等因素进行主要考量。本章最后会安排一次关于HNSW实现和调整的实际操作环节。
1.1 重温向量嵌入与搜索基础
1.2 分层可导航小世界 (HNSW) 内部机制
1.3 倒排文件索引 (IVF) 变体
1.4 乘积量化 (PQ) 工作原理
1.5 其他基于图的近似最近邻(ANN)方法(例如,NSG,Vamana)
1.6 选择合适的近似最近邻算法:性能取舍
1.7 HNSW的实战操作:实现与调优
© 2026 ApX Machine Learning用心打造