趋近智
当用户在您的检索增强生成(RAG)系统中进行查询时,他们的查询往往只是初步的语句,并非获取知识库中完整信息的理想方式。查询可能简短、模糊,使用的词汇与您的文档不同,或者未能准确表达真实的信息需求。这时,查询增强就显得重要。它是一套旨在优化、扩展或改写原始用户查询的技术,以提高其在检索阶段匹配相关文档的几率。通过智能地调整查询,您可以弥合用户意图与文档集合之间的语义差异,从而为生成器提供更准确、全面的上下文 (context)。
有效的查询增强可以显著减少“未找到相关内容”的情况,并直接提升最终生成回答的质量。下面我们来讨论主要策略:查询扩展和查询改写。
查询扩展旨在通过添加新词或短语来丰富原始查询。这有助于检索到可能使用同义词、相关术语或对同一概念有不同表达的文档。目标是撒下更广但仍相关的搜索网。
最直接的扩展方法之一是识别查询中的词语并添加其同义词。例如,如果用户查询“如何修复RAG延迟”,扩展后的查询可能包含“如何解决RAG响应时间问题”或“RAG性能延迟故障排除”。
同义词来源包括:
同样,缩写词和简称在查询和文档中很常见。“LLM”理想情况下应与提及“大型语言模型”的文档匹配,反之亦然。系统会维护这些映射关系:
尽管功能强大,但不加区分的同义词扩展有时可能导致查询漂移,即扩展后的查询偏离了原始意图。上下文 (context)很关键。将“bank”作为“金融机构”的同义词添加是可行的,但如果查询是关于“河岸”,那就有问题了。因此,需要仔细选择或对扩展词进行加权。
除了直接同义词外,您还可以使用语义相关的术语来扩展查询。当用户的初始查询宽泛或使用高层术语时,这种方法尤其有用。例如,关于“可持续能源”的查询可以扩展到包括“太阳能”、“风力涡轮机”、“地热能”或“可再生资源”。
查找相关术语的方法包括:
原始查询:“向量数据库索引的最佳实践。”
LLM生成的相关术语:“ANN算法”、“HNSW”、“IVFADC”、“向量相似性搜索”、“嵌入存储。”以下图示说明了不同的扩展技术如何增强初始查询:
一个图示,说明如何使用同义词、缩写词和相关术语扩展来增强初始用户查询。
复杂的用户查询通常将多个问题或方面包含在单个句子中。例如,“在RAG系统中用于金融文档分析时,使用不同重排序模型的性能和成本影响是什么?”这个查询暗含着对性能、成本、重排序模型、RAG系统和金融文档的询问。
将此类查询分解为更简单的子查询,可以针对每个方面进行更具针对性的检索。LLM在这方面非常有效:
原始查询:“比较混合搜索与密集检索在医疗RAG系统中的准确性和延迟。”
LLM生成的子查询:
“医疗RAG系统中混合搜索的准确性”“医疗RAG系统中混合搜索的延迟”“医疗RAG系统中密集检索的准确性”“医疗RAG系统中密集检索的延迟”“混合搜索与密集检索在医疗RAG中的比较”这些子查询的结果随后可以汇总或处理,以综合生成对原始复杂查询的回答。当您的文档粒度较细,并且涉及主题的特定方面而非提供全面概述时,这种方法会尤其有利。
查询改写调整原始查询的结构或措辞,而不仅仅是添加词语。其目的通常是使查询更贴近文档集合中使用的语言,或生成一种对相似性搜索更有效的表示形式。
这是一个基本的预处理步骤。打字错误、拼写错误和不一致的大小写很容易导致检索失败。
虽然看似基础,但拼写更正和规范化对于用户输入不受限制的生产系统极为重要。
有时,用户的措辞尽管语法正确,但可能不是最适合检索的。可以利用LLM将查询重写或改写为可能产生更好结果的其他形式。
原始查询:“我的RAG太慢了,该怎么办?”
LLM改写后的查询:
“RAG系统中降低延迟的方法。”“优化检索增强生成管道的性能。”“如何提升RAG系统响应时间?”这些改写后的查询使用更正式和描述性的语言,这通常更接近技术文档或研究论文中可能构成您知识库的术语。您可以随后使用原始查询和一个或多个改写版本进行搜索,并可能结合结果。
HyDE是一种更为先进的改写技术,它表现出很大的潜力。HyDE不是直接嵌入(通常简短且关键词多的)用户查询,而是使用LLM生成一份回答该查询的文档。这份生成文档内容更详尽、上下文 (context)更丰富,随后将其嵌入,并使用其嵌入向量 (vector)来搜索向量存储库。
其原理是,理想的回答文档在嵌入空间中,可能比简洁的原始查询更接近实际的相关文档。
处理流程如下:
HyDE处理流程图示如下:
文档嵌入(HyDE)的处理流程。LLM生成对用户查询的回答。这份文档随后被嵌入,并用于对实际文档集合进行检索。
当查询抽象或查询与文档之间存在明显的词汇不匹配时,HyDE尤其有效。生成的文档充当了“语义桥梁”。
尽管查询增强带来了强大的益处,但它并非万灵药,需要谨慎实施。
查询增强是一个活跃的领域,技术的选择将取决于您的RAG系统的具体要求、数据的性质以及用户查询的特点。通过周密地扩展和改写查询,您可以使RAG系统更好地理解用户意图,并检索到最贴切的信息,从而为高质量的生成奠定更坚实的基础。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•