趋近智
运行标准模型的机器学习系统已是成熟做法。然而,大型语言模型 (LLM) 通常包含数十亿或数万亿个参数 (例如,参数量 的模型),带来了不同的运行要求,这些要求对传统 MLOps 提出了更高要求。它们庞大的规模、训练和推理的计算需求以及特有的故障模式,使得需要采用专门的方法。
本章阐述了 LLMOps 的基本原理。我们将审视已有的 MLOps 原理如何调整适用,以及它们在应用于 LLM 时存在的不足之处。您将了解到:
在本章结束时,您将理解大型模型在运行管理方面的特殊情况和要求,这将为您学习后续章节中介绍的具体方法做好准备。
1.1 从MLOps到LLMOps的转变
1.2 大语言模型在生产中的特有挑战
1.3 大型模型所需的基础设施
1.4 LLMOps 生命周期阶段
1.5 LLMOps 工具选用要点
© 2026 ApX Machine Learning用心打造