GLM-5.2

开源

开放权重

参数

744B

上下文长度

模态

Text

架构

Dense

许可证

MIT

发布日期

13 Jun 2026

训练数据截止日期

系统要求

不同量化方法和上下文大小的显存要求

1024 个令牌

1568.02 GB VRAM

消费级

98x RTX 4090

24GB VRAM

数据中心

25x NVIDIA A100

80GB VRAM

Apple Silicon

21x Apple M3 Max

128GB VRAM

1000000 个令牌

5589.45 GB VRAM

消费级

491x RTX 4090

24GB VRAM

数据中心

106x NVIDIA A100

80GB VRAM

Apple Silicon

113x Apple M3 Max

128GB VRAM

架构图

评估基准

没有可用的 GLM-5.2 评估基准。

排名

编程排名

关于 GLM-5.2

Z.ai 于 2026 年 6 月 13 日发布的旗舰级开源权重基础模型。这是一款拥有 7,440 亿参数的混合专家（MoE）模型，由 IndexShare 技术驱动，每个 token 的激活参数量为 400 亿。该模型具备稳定的 100 万 token 上下文窗口，针对长程代码编写和智能体（Agent）工作流进行了优化，支持多种思考力度等级（High 和 Max），并在基准测试中表现强劲（Terminal-Bench 2.1 得分为 81.0，SWE-bench Pro 得分为 62.1）。支持思考模式、流式输出、函数调用、上下文缓存、结构化输出以及 MCP 集成。该模型采用 MIT 许可证发布，无地域限制。定价为每百万输入 token 1.40 美元，每百万输出 token 4.40 美元。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

192

位置嵌入

Absolute Position Embedding

RoPE Theta

8,000,000

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

RMS Normalization

激活函数

Swish

维度

隐藏维度大小

6,144

层数

FFN 中间层大小（稠密层）

12,288

多 Token 预测头数

分词器

词汇量大小

154,880

资源

官方文档下载权重

关于 GLM-5.2

Z.ai's GLM-5.2 is a 744-billion-parameter Mixture-of-Experts flagship foundation model, released June 13, 2026, designed for long-horizon coding and agentic engineering tasks. It features a usable 1M-token context window, IndexShare architecture reducing compute to 1/20th of prior generations, and multiple thinking-effort levels. Open-weights under MIT license with no regional restrictions.

其他 GLM-5.2 模型

没有相关模型