所有课程

大型语言模型应用高级向量检索

章节 1: 近似最近邻算法

重温向量嵌入与搜索基础

分层可导航小世界 (HNSW) 内部机制

倒排文件索引 (IVF) 变体

乘积量化 (PQ) 工作原理

其他基于图的近似最近邻（ANN）方法（例如，NSG，Vamana）

选择合适的近似最近邻算法：性能取舍

HNSW的实战操作：实现与调优

章节 2: 向量搜索性能与效率的优化

量化技术：标量量化与乘积量化

实现优化乘积量化 (OPQ)

二进制哈希与局部敏感哈希 (LSH) 回顾

高级过滤策略：预过滤与后过滤

将元数据与向量一同高效索引

硬件加速考量 (CPU SIMD, GPU)

内存管理与缓存策略

实践：应用量化与过滤

章节 3: 混合搜索方法

纯向量搜索的局限性

结合关键词搜索（BM25, TF-IDF）

结果合并与排序方法

倒数排序融合（RRF）及其他融合算法

基于图的向量搜索增强

多模态搜索的考量

动手实践：构建混合搜索流程

章节 4: 面向生产系统的向量搜索扩容

分布式向量数据库架构

向量索引的分片策略

复制与高可用性

负载均衡搜索查询

向量搜索性能指标监控

生产环境中索引的更新与维护

大规模部署的成本优化

实践：配置分布式系统

章节 5: 高级调优与评估

评估指标再审视：召回率、准确率、延迟

构建用于评估的真实标准数据集

参数敏感度分析 (HNSW, IVF)

搜索算法的 A/B 测试框架

调试搜索相关性问题

在线与离线评估方法

针对特定应用需求的调整（RAG 与语义搜索）

动手实践：全面性能评估

构建用于评估的真实标准数据集

使用 Kerb 更快构建 LLM 应用

简洁的语法。内置调试功能。从第一天起就可投入生产。

为 ApX 背后的 AI 系统而构建

这部分内容有帮助吗？

参考文献

Introduction to Information Retrieval, C.D. Manning, P. Raghavan, H. Schütze, 2008 (Cambridge UP) - 涵盖信息检索的基础概念，包括评估指标、相关性以及搜索系统设计。
Relevance Assessments for Information Retrieval Evaluation, Ellen M. Voorhees, Donna Harman, 2011 (John Wiley & Sons, Inc.) DOI: 10.1002/9781119125307.ch8 - 探讨在创建高质量信息检索相关性评估和测试集时所涉及的方法和挑战。
BEIR: A Heterogeneous Benchmark for Zero-shot Evaluation of Information Retrieval Models, Nandan Thakur, Nils Reimers, Andreas Rücklé, Abhishek Srivastava, Iryna Gurevych, 2021 NeurIPS 2021 Dataset and Benchmark Track DOI: 10.48550/arXiv.2104.08663 - 介绍一个用于评估信息检索模型的综合基准，涵盖多样的任务，强调标准化评估的重要性。

© 2026 ApX Machine Learning用心打造