大规模RAG部署中的安全考量

随着您的检索增强生成 (RAG)系统发展为更精密的分布式架构，具备多跳推理 (inference)、代理行为以及处理多样数据形式的能力，它们的攻击面和安全漏洞的潜在影响大幅增加。保护这些大规模RAG部署需要采用多层防御策略，处理数据生命周期、模型交互以及底层基础设施中的弱点。忽视这些考量可能导致数据外泄、系统被操纵、拒绝服务以及用户信任的流失。

高级RAG系统中扩展的攻击面

分布式RAG系统，其自身特性决定了它们包含众多相互连接的组件，每个组件都为恶意攻击者提供了潜在的切入点。本章中讨论的这些高级架构，例如那些使用多个大型语言模型、外部工具或复杂数据管道的架构，进一步增加了这种复杂性。

本图描绘了分布式RAG系统中潜在的攻击路径。数据摄入管道、向量 (vector)数据库、LLM服务以及外部工具集成等组件，各自引入了特定的弱点。

主要关注方面包括：

数据摄入管道：容易受到数据投毒的影响，即恶意内容被引入以破坏知识库或操纵输出。输入验证不足也可能导致处理错误或注入攻击。
向量数据库：未经授权的访问可能导致敏感嵌入 (embedding)数据的外泄。操纵索引或嵌入向量可能损害检索质量。
检索模型：对嵌入模型的对抗性攻击可能导致错误分类或检索到不相关的文档。模型窃取也是专有检索算法的一个问题。
大型语言模型 (LLMs)：容易受到提示注入、越狱以及通过精心设计的输入造成数据泄露。在多LLM设置中，一个被攻破的LLM可能会影响下游任务或传播恶意输出。
协调层：如果遭到破坏，攻击者可以控制整个RAG工作流程，修改系统行为，或从不同阶段窃取数据。
API和外部接口：标准Web应用程序的弱点（例如OWASP Top 10）适用，但RAG系统的生成能力和数据访问带来了额外的风险。使用外部工具的代理RAG系统，如果工具API不安全或权限过于宽泛，会带来新的攻击途径。

分布式场景下的数据安全与隐私

在分布式RAG系统中保护数据在其整个生命周期内的安全是根本所在。这包括确保数据在传输中、静态存储中以及日益增多的使用中的安全。

确保数据传输中和静态存储中的安全

您的分布式RAG架构中所有服务间的通信都必须使用强大的TLS（例如TLS 1.3）进行加密。这适用于API网关、协调器、检索服务、向量 (vector)数据库和LLM推理 (inference)端点之间的数据流。

对于静态存储的数据，请对所有持久化存储采用加密措施：

原始文档存储：使用云存储服务提供的服务器端加密（SSE）（例如S3 SSE-KMS，使用客户管理密钥的Azure Blob存储）。
向量数据库：大多数企业级向量数据库（例如Pinecone、Weaviate、Milvus）提供静态加密。确保启用此功能并配置强大的密钥管理方案。
LLM模型和工件：加密存储的模型权重 (weight)和微调 (fine-tuning)数据集。
日志和备份：加密所有日志和系统备份。

考虑信封加密，即数据使用数据加密密钥（DEK）进行加密，而DEK本身则由专门的密钥管理服务（KMS）管理的密钥加密密钥（KEK）进行加密。

保护使用中的数据

保护数据在嵌入 (embedding)模型或LLMs处理过程中的安全是一项挑战。

安全飞地：对于高度敏感的数据，可以考虑使用安全飞地（例如AWS Nitro Enclaves、Intel SGX、AMD SEV）。这些技术提供隔离的执行环境，代码和数据即使在主机操作系统下也能得到保护。涉及个人身份信息（PII）的嵌入生成或特定LLM推理 (inference)任务可以转移到飞地中执行。
同态加密 (HE)：尽管计算密集且尚未成为LLM推理的主流，但HE允许对加密数据进行计算。其在RAG中的应用是一个活跃的研究方向，特别是对于隐私保护的检索。

访问控制和数据治理

在所有组件中实施严格的基于角色的访问控制（RBAC）。最小权限原则非常重要：服务和用户应只拥有必需的最低权限。

细粒度权限：对于多租户RAG系统或访问多样化数据集的系统，确保向量 (vector)数据库和文档存储中的数据隔离和细粒度访问控制。
PII脱敏和掩码：将自动PII检测和脱敏/掩码集成到您的数据摄入管道中。这降低了敏感数据被嵌入 (embedding)或被LLM无意中泄露的风险。请注意，嵌入本身有时可能泄露原始文本的信息。
合规性：遵守相关的数据隐私法规（GDPR、CCPA、HIPAA）。为数据访问和处理实施审计跟踪。数据驻留要求可能需要部署区域RAG堆栈或仔细管理数据流。

模型安全：保护您的AI资产

模型本身，包括检索器和生成器，都是有价值的资产和潜在的安全弱点。

缓解提示注入和越狱

提示注入仍然是LLMs面临的一个重大威胁。在分布式RAG中，一次成功的注入可能导致从检索到的上下文 (context)中数据外泄、代理系统中未经授权的工具使用，或生成有害内容。

输入净化和验证：在构建提示之前，严格验证和净化所有用户输入和从外部源检索的数据。
输出过滤和防护：实施过滤器以检测并阻止LLM输出中的恶意模式或敏感信息。采用诸如检查指令式短语或尝试调用受限功能等方法。
指令微调 (fine-tuning)模型：如果对分布外的指令进行仔细处理，经过特定指令格式微调的模型对某些类型的注入可能不太敏感。
上下文分离：在提示中明确区分用户输入、检索到的文档和系统指令。使用XML标签或其他结构性标记 (token)可以帮助LLM区分这些内容，尽管这并非万无一失的方案。
多阶段LLM审查：在高风险应用中，可以考虑使用一个次要的、更简单的LLM来审查主要生成LLM的输出，以确保安全性和政策合规性。

避免LLM响应造成数据泄露

LLMs可能会无意中泄露其训练数据中的敏感信息，或者在RAG中，更重要的是泄露检索到的上下文 (context)中的敏感信息。

安全微调 (fine-tuning)：微调LLMs，使其不那么容易逐字重复特定的训练示例或上下文。
检索限制：将检索范围限制在仅对查询必要的内容，从而减少上下文泄露的攻击面。
后处理过滤器：对LLM输出应用过滤器，以检测和删除可能从检索到的文档中包含的PII或其他敏感数据。

对模型的对抗性攻击

检索模型，特别是密集检索器，可能容易受到对抗性示例的影响，这些示例会导致它们获取不正确或恶意的文档。

对抗性训练：使用对抗性示例增强嵌入 (embedding)模型的训练数据，以提高其韧性。
集成检索器：结合多样化的检索方法（例如稀疏、密集、基于图的）可以使单一的对抗技术更难成功。
重排序阶段：如果重排序器使用与初始检索器不同的信号或模型，它可以帮助过滤掉对抗性检索到的文档。

保护专有模型

您的自定义嵌入 (embedding)模型或微调 (fine-tuning)LLMs代表着重要的知识产权。

模型端点访问控制：使用强大的认证和授权来保护模型服务端点。
模型混淆/水印：可以研究在模型输出中嵌入水印或混淆模型架构以阻止窃取的方法，尽管这些方法通常难以有效实施。
安全服务环境：将模型部署在可信执行环境或安全容器运行时中。

基础设施和运维安全

您的分布式RAG系统的底层基础设施和MLOps实践对于其整体安全态势非常重要。

安全的服务通信和网络设计

双向TLS (mTLS)：对所有内部服务间通信强制执行mTLS，特别是在Kubernetes集群内部。这确保了通信双方都经过认证。
网络分段：将RAG系统的不同部分（例如数据摄入、向量 (vector)数据库集群、LLM推理 (inference)农场、API网关）隔离到单独的虚拟私有云（VPC）或具有严格防火墙规则的子网中。
API网关安全：使用API网关管理外部访问，强制执行速率限制，执行身份验证，并可能应用针对AI工作负载定制的Web应用程序防火墙（WAFs）。

秘密管理

切勿硬编码秘密（API密钥、数据库凭据、证书）。使用专门的秘密管理方案，例如HashiCorp Vault、AWS Secrets Manager或Azure Key Vault。在可能的情况下，确保秘密的自动轮换。

容器和供应链安全

强化基础镜像：为您的容器使用最小化、强化的基础镜像。定期使用Trivy或Clair等工具扫描镜像中的弱点。
运行时安全监控：实施容器的运行时安全监控（例如Falco、Aqua Security），以检测异常行为或入侵。
软件物料清单 (SBOM)：为您的所有服务维护SBOM，以跟踪依赖项并快速识别受新发现弱点影响的组件。
验证预训练 (pre-training)模型：从公共中心使用预训练模型时，验证其来源并扫描它们以查找潜在的嵌入 (embedding)式恶意软件或安全风险。

全面日志记录和安全监控

集中式日志记录：将所有组件（应用程序、基础设施、网络）的日志聚合到一个集中式安全信息和事件管理（SIEM）系统中。
异常检测：在日志和指标上实施异常检测，以识别不寻常的查询模式、访问尝试、数据外泄迹象或可能预示攻击的资源消耗高峰。
警报：为重要的安全事件配置警报，例如登录失败尝试、未经授权的API调用或检测到已知的恶意输入。

应对RAG特定的攻击路径

除了常规的应用程序安全，大规模RAG系统还面临独特的威胁。

索引投毒

攻击者可能尝试向您的知识库注入恶意或带有偏见的文档。这些文档一旦被嵌入 (embedding)和索引，就可以被检索出来误导用户、散布虚假信息，甚至如果其内容被设计用来利用解析器或LLM本身，还可能触发下游的弱点。

缓解措施：
- 数据摄入期间严格的输入验证和净化。
- 对外部数据进行来源信誉检查和内容审查。
- 对新的嵌入向量 (vector)进行异常检测；不寻常的聚类或异常嵌入向量可能表明投毒尝试。
- 定期审计已索引的内容。

检索操纵

这些攻击旨在强制检索器选择特定的、通常是有害的文档，无论查询的真实意图如何。

缓解措施：
- 防御对嵌入 (embedding)模型的对抗性攻击（请参阅模型安全部分）。
- 对轻微对抗性扰动具有弹性的查询扩展技术。
- 复杂的重排序阶段，利用多种特征而非仅仅嵌入相似度来评估文档关联性。
- 检索多样性：从多个来源或使用多种方法进行检索，然后进行协调。

拒绝服务 (DoS/DDoS)

LLM推理 (inference)和密集向量 (vector) (dense vector)搜索是计算密集型的。攻击者可以通过大量请求瞄准这些组件，以耗尽资源。

缓解措施：
- 在API网关和单个服务级别进行速率限制。
- 对所有组件进行自动扩缩容，特别是LLM服务和向量数据库。
- 针对频繁访问的查询和检索到的文档采用缓存策略。
- WAFs用于过滤恶意流量模式。

间接提示注入

恶意指令嵌入 (embedding)在知识库的文档中。当这些文档被检索并包含在LLM的上下文 (context)中时，嵌入的指令可以执行。

缓解措施：
- 这是RAG特定攻击中最难防范的一种。
- 在摄入期间严格净化文档内容，查找指令式模式或已知的漏洞负载。
- 使用经过专门微调 (fine-tuning)的LLM，以区分系统提示、用户查询和检索到的内容，并忽略检索内容中的指令。
- 输出过滤以捕获意外行为或输出。
- 对于代理RAG，对于仅基于检索到的文档信息而采取的任何操作，需极其谨慎并进行沙盒处理。

设计安全和持续关注

对于复杂的分布式RAG系统，安全不能是事后才考虑的事情。它必须集成到设计、开发和操作阶段。

威胁建模：定期对您的RAG架构进行专门的威胁建模实践。识别潜在威胁、弱点和影响，并优先采取缓解措施。
纵深防御：实施多层安全控制。不应依赖任何单一控制措施为万无一失。
安全审计和渗透测试：聘请第三方安全专家进行定期审计和渗透测试，重点关注RAG特有的弱点。
保持更新：AI安全方面正迅速发展。请及时了解新的攻击技术和防御策略。

您正在构建的高级RAG架构提供了强大的功能，但其复杂性需要对安全性进行相应的投入。通过认真应用这些安全考量，您可以构建出不仅强大且可扩展，而且能够抵御新出现的威胁的系统。

使用 Kerb 更快构建 LLM 应用

简洁的语法。内置调试功能。从第一天起就可投入生产。

为 ApX 背后的 AI 系统而构建

这部分内容有帮助吗？

参考文献

OWASP Top 10 for Large Language Model Applications, OWASP Foundation, 2023 (OWASP Foundation) - 一份综合指南，概述了大型语言模型应用程序中的关键安全漏洞，提供了适用于RAG组件的可操作缓解策略。