ApX 标志ApX 标志

趋近智

Gemma 4 26B A4B

活跃参数

25.2B

上下文长度

256K

模态

Multimodal

架构

Mixture of Experts (MoE)

许可证

Apache 2.0

发布日期

2 Apr 2026

训练数据截止日期

-

技术规格

注意力

注意力结构

Grouped-Query Attention

注意力头

16

键值头

8

注意力头维度

256

位置嵌入

ROPE

RoPE Theta

10,000

滑动窗口注意力

Yes

滑动窗口大小

1,024

归一化

RMS Normalization

激活函数

GELU

维度

隐藏维度大小

2,112

层数

30

FFN 中间层大小(稠密层)

704

多 Token 预测头数

-

分词器

词汇量大小

262,144

混合专家

专家参数总数

3.8B

专家数量

128

活跃专家

8

共享专家数

-

FFN 中间层大小(每专家)

704

MoE 前的稠密层数

-

架构图

Input TokensToken EmbeddingPosition: RoPEHidden: 2.1k · Context: 256k · Vocab: 262.1kx 30 layersRMSNormPre-AttentionGrouped-Query Attention16Q / 8KV heads · SW: 1kHead dim: 256+RMSNormPre-FFNSparse MoE FFN (8/128 experts)GELUIntermediate: 704+Final RMSNormOutput Logits

Gemma 4 26B A4B

Gemma 4 26B A4B 是一款混合专家 (MoE) 模型,总参数量为 25.2B,但每次推理仅激活 3.8B 参数,在提供接近 31B 模型性能的同时,实现了 4B 模型级的推理速度。该模型拥有 128 个专家(其中 8 个激活),配备 256K 上下文窗口,并支持文本和图像输入。它针对消费级 GPU 的快速推理进行了优化,同时具备前沿水平的推理和编程能力。

关于 Gemma 4

Gemma 4 is Google DeepMind's most advanced open model family, built from Gemini 3 research and technology. Featuring both Dense and Mixture-of-Experts (MoE) architectures, these multimodal models handle text, images, and audio (on smaller variants), with context windows up to 256K tokens. Designed for frontier-level performance across reasoning, coding, and agentic workflows, Gemma 4 delivers unprecedented intelligence-per-parameter from mobile devices to enterprise servers. Released under Apache 2.0 license.


其他 Gemma 4 模型

评估基准

排名

#73

没有可用的 Gemma 4 26B A4B 评估基准。

排名

排名

#73

编程排名

-

模型完整性

总分

B

70 / 100

GPU 要求

完整计算器

选择模型权重的量化方法

上下文大小:1024 个令牌

1k
125k
250k

所需显存:

推荐 GPU