趋近智

APX AI

在线

我可以读取您正在浏览的页面。随时向我提问！

趋近智

所有课程

向量数据库与语义搜索实现

章节 1: 向量嵌入与向量空间

从数据到向量：回顾

嵌入模型概述

理解向量维度

降维技术概述

测量向量空间中的相似度

动手实践：生成与比较嵌入

第 1 章测验

章节 2: 向量数据库介绍

什么是向量数据库？

核心架构组成部分

数据模型与数据结构定义

向量操作：CRUD

元数据过滤

实践操作：向量数据库基本交互

第 2 章测验

章节 3: 近似最近邻 (ANN) 搜索

近似的需求

ANN 的核心思想

算法概览：HNSW

算法概述：IVF

算法概述：LSH

索引参数与调优

评估 ANN 性能

动手实践：调整索引参数的试验

第 3 章测验

章节 4: 构建语义搜索系统

语义搜索与关键词搜索再比较

语义搜索流程的架构

数据准备与分块处理

查询处理与向量化

结果排序与再排序

实现混合搜索

评估语义搜索相关性

动手实践：设计搜索查询流程

第 4 章测验

章节 5: 向量数据库的应用实践

选择向量数据库平台

使用 Pinecone 客户端

使用 Weaviate 客户端

使用 Milvus 客户端

使用 ChromaDB 客户端

高效索引大型数据集

监控与维护

动手实践：构建小型语义搜索应用

第 5 章测验

近似最近邻搜索 | 课程第三章

章节 3: 近似最近邻 (ANN) 搜索

在庞大的高维向量 (vector)集合中查找精确最近邻，计算成本可能非常高，对于交互式应用来说通常速度过慢。在处理向量数据库的规模时，对每次查询都执行穷举搜索通常不切实际。

本章将通过引入近似最近邻 (ANN) 搜索来应对这一挑战。您将了解到为何近似处理通常是必要的，以及 ANN 算法如何通过牺牲少量准确性来换取搜索速度和资源使用方面的大幅提升，从而提供一个实用的解决方案。

我们将涵盖：

高维空间 (high-dimensional space)中精确最近邻搜索的计算限制。
ANN 的核心原理，特别是搜索召回率与延迟等性能指标之间的权衡。
常见 ANN 算法的概述，包括分层可导航小世界 (HNSW)、倒排文件索引 (IVF) 和局部敏感哈希 (LSH)，并解释它们各自的工作方式。
用于构建和调整 ANN 索引的主要参数 (parameter)（例如， $ef\_construction$ 、 $ef\_search$ 、 $nlist$ 、 $m$ ）及其影响。
使用相关指标评估 ANN 索引有效性和效率的方法。

本章最后将通过一个动手实践环节结束，您将尝试构建不同的 ANN 索引并观察由此产生的性能表现。

课程章节

3.1 近似的需求
3.2 ANN 的核心思想
3.3 算法概览：HNSW
3.4 算法概述：IVF
3.5 算法概述：LSH
3.6 索引参数与调优
3.7 评估 ANN 性能
3.8 动手实践：调整索引参数的试验

© 2026 ApX Machine Learning