趋近智
用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。
这部分内容有帮助吗?
transformers 库的官方文档,详细介绍了如何加载 4 位和 8 位量化模型。optimum 库的官方文档,支持模型优化、量化以及在各种硬件上部署。bitsandbytes: 8-bit Optimizers and Quantization Functions for PyTorch, Tim Dettmers, 2023 - bitsandbytes 库的 GitHub 仓库,为 PyTorch 模型提供核心的 4 位和 8 位量化功能。© 2025 ApX Machine Learning用心打造