DeepSpeed 介绍

全新 · 开源

用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。

这部分内容有帮助吗？

参考文献

ZeRO: Memory Optimizations Toward Training Trillion Parameter Models, Samyam Rajbhandari, Jeff Rasley, Olatunji Ruwase, and Yuxiong He, 2020 SC '20: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (IEEE) DOI: 10.1109/SC44002.2020.9251842 - 介绍了ZeRO（零冗余优化器）技术系列，这是DeepSpeed在大型模型训练中大幅减少内存占用的基础性贡献，通过对优化器状态、梯度和参数进行分区实现。
DeepSpeed Documentation, Microsoft DeepSpeed Team, 2024 (Microsoft) - DeepSpeed的官方综合文档，提供安装、配置、API使用以及包括ZeRO、内存卸载和流水线并行在内的所有功能的详细指南和实践示例。