趋近智
掌握精巧的向量 (vector)检索技术,以提升大型语言模型应用的性能和关联性。本课程介绍先进的索引算法、优化策略、混合检索方法,以及在生产环境中扩展向量检索系统。适合希望构建高性能语义检索和检索增强生成(RAG)系统的工程师。
先修课程 机器学习与向量检索入门知识
级别:
高级索引算法
实施并剖析复杂的近似最近邻(ANN)索引结构,如HNSW、IVF变体和基于图的方法。
向量检索优化
应用量化(标量、乘积)等技术、先进过滤和硬件考量,以优化检索延迟和吞吐量。
混合检索实现
将向量检索与传统方法(如关键词检索(BM25)和图技术)结合,以提升关联性。
元数据过滤策略
设计并实施高效的预过滤和后过滤机制,使用相关元数据。
可扩展性与部署
架构并管理分布式向量检索系统,面向大规模生产环境下的LLM应用。
性能调优
调整索引参数和查询执行计划,以实现召回率、精确度和速度之间的最佳平衡。
© 2026 ApX Machine Learning用心打造