趋近智
所有课程
5.1 缓解低比特量化中的精度损失
5.2 处理激活和权重的离群值
5.3 量化特定LLM组成部分(注意力机制、归一化)
5.4 硬件限制与内核支持
5.5 动态量化与静态量化的权衡
5.6 量化问题调试
5.7 将量化模型整合到生产管线中
5.8 实践:微调量化参数
© 2025 ApX Machine Learning