趋近智
活跃参数
25.2B
上下文长度
256K
模态
Multimodal
架构
Mixture of Experts (MoE)
许可证
Apache 2.0
发布日期
2 Apr 2026
训练数据截止日期
-
注意力
注意力结构
Grouped-Query Attention
注意力头
16
键值头
8
注意力头维度
256
位置嵌入
ROPE
RoPE Theta
10,000
滑动窗口注意力
Yes
滑动窗口大小
1,024
归一化
RMS Normalization
激活函数
GELU
维度
隐藏维度大小
2,112
层数
30
FFN 中间层大小(稠密层)
704
多 Token 预测头数
-
分词器
词汇量大小
262,144
混合专家
专家参数总数
3.8B
专家数量
128
活跃专家
8
共享专家数
-
FFN 中间层大小(每专家)
704
MoE 前的稠密层数
-
Gemma 4 26B A4B 是一款混合专家 (MoE) 模型,总参数量为 25.2B,但每次推理仅激活 3.8B 参数,在提供接近 31B 模型性能的同时,实现了 4B 模型级的推理速度。该模型拥有 128 个专家(其中 8 个激活),配备 256K 上下文窗口,并支持文本和图像输入。它针对消费级 GPU 的快速推理进行了优化,同时具备前沿水平的推理和编程能力。
Gemma 4 is Google DeepMind's most advanced open model family, built from Gemini 3 research and technology. Featuring both Dense and Mixture-of-Experts (MoE) architectures, these multimodal models handle text, images, and audio (on smaller variants), with context windows up to 256K tokens. Designed for frontier-level performance across reasoning, coding, and agentic workflows, Gemma 4 delivers unprecedented intelligence-per-parameter from mobile devices to enterprise servers. Released under Apache 2.0 license.
排名
#73
没有可用的 Gemma 4 26B A4B 评估基准。
APX AI
在线