所有课程

大型语言模型应用高级向量检索

章节 1: 近似最近邻算法

重温向量嵌入与搜索基础

分层可导航小世界 (HNSW) 内部机制

倒排文件索引 (IVF) 变体

乘积量化 (PQ) 工作原理

其他基于图的近似最近邻（ANN）方法（例如，NSG，Vamana）

选择合适的近似最近邻算法：性能取舍

HNSW的实战操作：实现与调优

章节 2: 向量搜索性能与效率的优化

量化技术：标量量化与乘积量化

实现优化乘积量化 (OPQ)

二进制哈希与局部敏感哈希 (LSH) 回顾

高级过滤策略：预过滤与后过滤

将元数据与向量一同高效索引

硬件加速考量 (CPU SIMD, GPU)

内存管理与缓存策略

实践：应用量化与过滤

章节 3: 混合搜索方法

纯向量搜索的局限性

结合关键词搜索（BM25, TF-IDF）

结果合并与排序方法

倒数排序融合（RRF）及其他融合算法

基于图的向量搜索增强

多模态搜索的考量

动手实践：构建混合搜索流程

章节 4: 面向生产系统的向量搜索扩容

分布式向量数据库架构

向量索引的分片策略

复制与高可用性

负载均衡搜索查询

向量搜索性能指标监控

生产环境中索引的更新与维护

大规模部署的成本优化

实践：配置分布式系统

章节 5: 高级调优与评估

评估指标再审视：召回率、准确率、延迟

构建用于评估的真实标准数据集

参数敏感度分析 (HNSW, IVF)

搜索算法的 A/B 测试框架

调试搜索相关性问题

在线与离线评估方法

针对特定应用需求的调整（RAG 与语义搜索）

动手实践：全面性能评估

纯向量搜索的局限性

全新 · 开源

Kerb - 大语言模型开发工具包

用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。

这部分内容有帮助吗？

参考文献

The Probabilistic Relevance Model: BM25 and Beyond, Stephen Robertson, Hugo Zaragoza, 2009 Foundations and Trends in Information Retrieval, Vol. 3: No. 4 (Now Publishers) DOI: 10.1561/1500000019 - 解释了BM25检索函数，这是一种词汇搜索方法，通过擅长精确的术语匹配来补充语义搜索。
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova, 2019 Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), Vol. 1 (Association for Computational Linguistics) DOI: 10.18653/v1/N19-1423 - 描述了BERT模型及其子词分词方法，与密集嵌入的形成方式及其OOV处理有关，并间接指出了其具体局限性。
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks, Nils Reimers and Iryna Gurevych, 2019 Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP) (Association for Computational Linguistics) DOI: 10.18653/v1/D19-1410 - 介绍了Sentence-BERT，一种广泛使用的生成密集句子嵌入的方法，对于理解其创建方式及其在捕捉特定语义细微之处的优势和局限性至关重要。

© 2025 ApX Machine Learning用心打造