基于前面学过的部署方法,本章解决大规模运行扩散模型时经常遇到的更复杂的运行要求。你将学习到一些技术,用于在地理上分散模型,通过多区域架构以降低延迟并提高可用性。我们将介绍安全引入变更的方法,例如对新模型版本或采样参数进行A/B测试。此外,本章还提出用于成本优化的高级策略,包括有效使用竞价实例以及减轻其中断影响的方法。最后,我们将分析具体的运行挑战,例如管理冷启动延迟以及配置适合扩散模型推理长时间处理的负载均衡。