所有课程

大型语言模型应用高级向量检索

章节 1: 近似最近邻算法

重温向量嵌入与搜索基础

分层可导航小世界 (HNSW) 内部机制

倒排文件索引 (IVF) 变体

乘积量化 (PQ) 工作原理

其他基于图的近似最近邻（ANN）方法（例如，NSG，Vamana）

选择合适的近似最近邻算法：性能取舍

HNSW的实战操作：实现与调优

章节 2: 向量搜索性能与效率的优化

量化技术：标量量化与乘积量化

实现优化乘积量化 (OPQ)

二进制哈希与局部敏感哈希 (LSH) 回顾

高级过滤策略：预过滤与后过滤

将元数据与向量一同高效索引

硬件加速考量 (CPU SIMD, GPU)

内存管理与缓存策略

实践：应用量化与过滤

章节 3: 混合搜索方法

纯向量搜索的局限性

结合关键词搜索（BM25, TF-IDF）

结果合并与排序方法

倒数排序融合（RRF）及其他融合算法

基于图的向量搜索增强

多模态搜索的考量

动手实践：构建混合搜索流程

章节 4: 面向生产系统的向量搜索扩容

分布式向量数据库架构

向量索引的分片策略

复制与高可用性

负载均衡搜索查询

向量搜索性能指标监控

生产环境中索引的更新与维护

大规模部署的成本优化

实践：配置分布式系统

章节 5: 高级调优与评估

评估指标再审视：召回率、准确率、延迟

构建用于评估的真实标准数据集

参数敏感度分析 (HNSW, IVF)

搜索算法的 A/B 测试框架

调试搜索相关性问题

在线与离线评估方法

针对特定应用需求的调整（RAG 与语义搜索）

动手实践：全面性能评估

针对特定应用需求的调整（RAG 与语义搜索）

全新 · 开源

Kerb - 大语言模型开发工具包

用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。

这部分内容有帮助吗？

参考文献

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela, 2020 NeurIPS, Vol. 33 DOI: 10.48550/arXiv.2005.11401 - 介绍了检索增强生成（RAG）框架，提供了对RAG目标及其检索组件精度要求的理解基础。
RAGAs: Automated Evaluation of Retrieval-Augmented Generation Systems, Shahul Es, Jithin James, Luis Espinosa-Anke, Steven Schockaert, 2023 arXiv preprint DOI: 10.48550/arXiv.2309.15217 - 提出了一个用于自动化评估RAG系统的框架，这对于理解和实施RAG的端到端评估策略非常相关。
Efficient and Robust Approximate Nearest Neighbor Search Using Hierarchical Navigable Small World Graphs, Yu. A. Malkov, D. A. Yashunin, 2020 IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 42 (IEEE Computer Society) DOI: 10.1109/TPAMI.2018.2889473 - 详细介绍了HNSW算法，这是一种流行的向量索引方法。这有助于理解efSearch等参数以及近似最近邻搜索中的核心召回率/精确度权衡。
An Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, 2008 (Cambridge University Press) - 一本经典的教材，涵盖了信息检索的基本概念，包括Precision@k、Recall@k、MAP和NDCG等评估指标，对于语义搜索评估至关重要。

© 2025 ApX Machine Learning用心打造