ApX 标志ApX 标志

趋近智

Gemma 4 E2B

参数

5.1B

上下文长度

128K

模态

Multimodal

架构

Dense

许可证

Apache 2.0

发布日期

2 Apr 2026

训练数据截止日期

-

技术规格

注意力

注意力结构

Grouped-Query Attention

注意力头

8

键值头

1

注意力头维度

256

位置嵌入

ROPE

RoPE Theta

10,000

滑动窗口注意力

Yes

滑动窗口大小

512

归一化

RMS Normalization

激活函数

GELU

维度

隐藏维度大小

6,144

层数

35

FFN 中间层大小(稠密层)

6,144

多 Token 预测头数

-

分词器

词汇量大小

262,144

架构图

Input TokensToken EmbeddingPosition: RoPEHidden: 6.1k · Context: 128k · Vocab: 262.1kx 35 layersRMSNormPre-AttentionGrouped-Query Attention8Q / 1KV heads · SW: 512Head dim: 256+RMSNormPre-FFNFeed-Forward NetworkGELUIntermediate: 6.1k+Final RMSNormOutput Logits

Gemma 4 E2B

Gemma 4 E2B 是一款专为移动和物联网设备设计的超高效模型,拥有 23 亿有效参数(采用逐层嵌入时为 51 亿)。该模型支持文本、图像和音频输入,具备 128K 上下文窗口,可在边缘设备上以接近零延迟和离线运行的方式提供前沿能力。此外,它还内置了推理模式和原生函数调用功能,支持智能体工作流。

关于 Gemma 4

Gemma 4 is Google DeepMind's most advanced open model family, built from Gemini 3 research and technology. Featuring both Dense and Mixture-of-Experts (MoE) architectures, these multimodal models handle text, images, and audio (on smaller variants), with context windows up to 256K tokens. Designed for frontier-level performance across reasoning, coding, and agentic workflows, Gemma 4 delivers unprecedented intelligence-per-parameter from mobile devices to enterprise servers. Released under Apache 2.0 license.


其他 Gemma 4 模型

评估基准

没有可用的 Gemma 4 E2B 评估基准。

排名

排名

-

编程排名

-

模型完整性

总分

B

66 / 100

GPU 要求

完整计算器

选择模型权重的量化方法

上下文大小:1024 个令牌

1k
63k
125k

所需显存:

推荐 GPU