趋近智
注意力
注意力结构
Multi-Head Attention
注意力头
64
键值头
64
注意力头维度
192
位置嵌入
Absolute Position Embedding
RoPE Theta
8,000,000
滑动窗口注意力
No
滑动窗口大小
-
归一化
RMS Normalization
激活函数
Swish
维度
隐藏维度大小
6,144
层数
78
FFN 中间层大小(稠密层)
12,288
多 Token 预测头数
1
分词器
词汇量大小
154,880
Z.ai 于 2026 年 6 月 13 日发布的旗舰级开源权重基础模型。这是一款拥有 7,440 亿参数的混合专家(MoE)模型,由 IndexShare 技术驱动,每个 token 的激活参数量为 400 亿。该模型具备稳定的 100 万 token 上下文窗口,针对长程代码编写和智能体(Agent)工作流进行了优化,支持多种思考力度等级(High 和 Max),并在基准测试中表现强劲(Terminal-Bench 2.1 得分为 81.0,SWE-bench Pro 得分为 62.1)。支持思考模式、流式输出、函数调用、上下文缓存、结构化输出以及 MCP 集成。该模型采用 MIT 许可证发布,无地域限制。定价为每百万输入 token 1.40 美元,每百万输出 token 4.40 美元。
Z.ai's GLM-5.2 is a 744-billion-parameter Mixture-of-Experts flagship foundation model, released June 13, 2026, designed for long-horizon coding and agentic engineering tasks. It features a usable 1M-token context window, IndexShare architecture reducing compute to 1/20th of prior generations, and multiple thinking-effort levels. Open-weights under MIT license with no regional restrictions.
没有可用的 GLM-5.2 评估基准。
APX AI
在线