趋近智
所有课程
2.1 LLM量化库概览
2.2 使用 bitsandbytes 进行低位操作
2.3 使用 Hugging Face Transformers 和 Accelerate 实现量化
2.4 使用 AutoGPTQ 应用 GPTQ
2.5 使用 AutoAWQ 应用 AWQ
2.6 比较工具包的输出和性能
2.7 处理模型兼容性问题
2.8 实践:使用多种工具包量化模型
© 2025 ApX Machine Learning