所有课程

向量数据库与语义搜索实现

章节 1: 向量嵌入与向量空间

从数据到向量：回顾

嵌入模型概述

理解向量维度

降维技术概述

测量向量空间中的相似度

动手实践：生成与比较嵌入

第 1 章测验

章节 2: 向量数据库介绍

什么是向量数据库？

核心架构组成部分

数据模型与数据结构定义

向量操作：CRUD

元数据过滤

实践操作：向量数据库基本交互

第 2 章测验

章节 3: 近似最近邻 (ANN) 搜索

近似的需求

ANN 的核心思想

算法概览：HNSW

算法概述：IVF

算法概述：LSH

索引参数与调优

评估 ANN 性能

动手实践：调整索引参数的试验

第 3 章测验

章节 4: 构建语义搜索系统

语义搜索与关键词搜索再比较

语义搜索流程的架构

数据准备与分块处理

查询处理与向量化

结果排序与再排序

实现混合搜索

评估语义搜索相关性

动手实践：设计搜索查询流程

第 4 章测验

章节 5: 向量数据库的应用实践

选择向量数据库平台

使用 Pinecone 客户端

使用 Weaviate 客户端

使用 Milvus 客户端

使用 ChromaDB 客户端

高效索引大型数据集

监控与维护

动手实践：构建小型语义搜索应用

第 5 章测验

算法概述：IVF

这部分内容有帮助吗？

参考文献

Searching in one billion vectors, Hervé Jégou, Matthijs Douze, Cordelia Schmid, 2011 IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 33 (IEEE) DOI: 10.1109/TPAMI.2010.57 - 介绍了IVFADC方法，该方法将倒排文件索引与乘积量化和非对称距离计算相结合，用于大规模数据集中的高效相似性搜索。
Product Quantization for Nearest Neighbor Search, Hervé Jégou, Matthijs Douze, Cordelia Schmid, 2011 IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 33 (IEEE Computer Society) DOI: 10.1109/TPAMI.2010.57 - 提出了乘积量化技术，用于压缩高维向量并有效估计其距离，是IVF-PQ等方法的基础。
FAISS Wiki: IVFPQ, Meta AI Research, 2025 - FAISS库中IVF和IVF-PQ实现的官方文档，提供了技术细节和参数说明，以便实际使用。

© 2026 ApX Machine Learning用心打造