张量并行 (TP)

全新 · 开源

用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。

这部分内容有帮助吗？

参考文献

DeepSpeed: System Optimizations for Large-Scale Model Training, Jie Ren, Hao Li, Samyam Rajbhandari, Conglong Li, Di He, Zhicheng Cui, Xuanli Chen, Junchao Li, Sholto Scruton, Minjia Zhang, 2021 ACM SIGOPS Operating Systems Review, Vol. 55 (ACM) DOI: 10.1145/3452044.3483742 - 这篇论文介绍了DeepSpeed，一个提供优化分布式训练能力的综合框架，其中包含多种与张量并行相辅相成的模型并行形式。
ZeRO: Memory Optimizations Toward Training Trillion Parameter Models, Samyam Rajbhandari, Jeff Rasley, Olatunji Ruwase, Yuxiong He, 2020 SC '20: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (IEEE Computer Society) DOI: 10.1109/SC45903.2020.00078 - 该论文主要关注优化器状态、梯度和参数的内存优化，ZeRO对于训练需要张量并行的大型模型至关重要。