趋近智
在研究了降低模型参数 (parameter)数值精度的方法之后,我们现在将注意力转向剪枝。剪枝技术旨在通过移除被认为不太重要的组件,来减小大型语言模型(LLMs)的体积,并可能加速其推理 (inference)。其基本思路是引入稀疏性,消除连接或整个结构元素,而不严重影响模型性能。
本章介绍多种方法来有效地实现这种稀疏性。您将学会:
在本章结束时,您将对如何选择、应用和评估优化大型语言模型的高级剪枝方法有实际的认识。
3.1 非结构化剪枝与结构化剪枝
3.2 强度剪枝
3.3 移动剪枝与动态稀疏性
3.4 结构化剪枝技术
3.5 剪枝与量化的结合
3.6 编译器和运行时对稀疏操作的支持
3.7 评估剪枝对大型语言模型能力的影响
3.8 实践:应用结构化剪枝