本章旨在为理解大型语言模型(LLM)打好铺垫。我们将从大型语言模型(LLM)的定义讲起,并将其与此前的序列模型作对比,梳理其发展脉络,直到当前的模型结构。此外,本章会说明模型大小和数据规模为何是影响大型语言模型表现和其涌现能力的根本原因。同时,我们还会概括这些模型开发过程中固有的主要计算和内存限制,并引出大型语言模型应用中涉及的常用软件框架及硬件加速器。