章节 1: 近似最近邻算法

在高维空间 (high-dimensional space)中查找查询向量 (vector)的精确最近邻点，这在使用大型语言模型（LLM）的嵌入 (embedding)时很常见，但其扩展性较差。采用精确 $k$ -NN 在数百万甚至数十亿向量中匹配最接近点，这对于诸多应用而言，计算耗费巨大，难以执行。

近似最近邻（ANN）算法通过舍弃完全精确度，换取搜索速度的极大提高，从而提供了实用方案。

本章将主要讲解几种广泛应用的ANN技术的核心运作方式，它们对于创建高效的向量搜索系统非常必要。我们将考察分层可导航小世界（HNSW）、倒排文件索引（IVF）的不同形式以及乘积量化 (quantization)（PQ）的构建与查询过程。我们还将介绍其他图结构方法，并探讨在选择合适算法时，如何根据构建时间、内存占用和查询表现等因素进行主要考量。本章最后会安排一次关于HNSW实现和调整的实际操作环节。