所有课程

向量数据库与语义搜索实现

章节 1: 向量嵌入与向量空间

从数据到向量：回顾

嵌入模型概述

理解向量维度

降维技术概述

测量向量空间中的相似度

动手实践：生成与比较嵌入

第 1 章测验

章节 2: 向量数据库介绍

什么是向量数据库？

核心架构组成部分

数据模型与数据结构定义

向量操作：CRUD

元数据过滤

实践操作：向量数据库基本交互

第 2 章测验

章节 3: 近似最近邻 (ANN) 搜索

近似的需求

ANN 的核心思想

算法概览：HNSW

算法概述：IVF

算法概述：LSH

索引参数与调优

评估 ANN 性能

动手实践：调整索引参数的试验

第 3 章测验

章节 4: 构建语义搜索系统

语义搜索与关键词搜索再比较

语义搜索流程的架构

数据准备与分块处理

查询处理与向量化

结果排序与再排序

实现混合搜索

评估语义搜索相关性

动手实践：设计搜索查询流程

第 4 章测验

章节 5: 向量数据库的应用实践

选择向量数据库平台

使用 Pinecone 客户端

使用 Weaviate 客户端

使用 Milvus 客户端

使用 ChromaDB 客户端

高效索引大型数据集

监控与维护

动手实践：构建小型语义搜索应用

第 5 章测验

结果排序与再排序

这部分内容有帮助吗？

参考文献

Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze, 2008 (Cambridge University Press) - 一本基础教材，涵盖了核心信息检索概念，包括索引、查询处理、评估和学习排序模型。
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks, Nils Reimers and Iryna Gurevych, 2019 Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP) DOI: 10.48550/arXiv.1908.10084 - 介绍了一种生成语义有意义句子嵌入的方法，并讨论了使用交叉编码器进行高质量语义重排序。
Reciprocal Rank Fusion (RRF): A Simple and Effective Hybrid Ranking Method, Jimmy Lin, Allan S. D. Tan, 2007 Proceedings of the 30th annual international ACM SIGIR conference on Research and development in information retrieval (ACM) DOI: 10.1145/1277741.1277797 - 介绍了倒数排名融合，这是一种无需分数归一化即可结合多个搜索组件排名列表的稳健技术。

© 2025 ApX Machine Learning用心打造