ApX 标志ApX 标志

趋近智

Gemma 4 E4B

参数

8B

上下文长度

128K

模态

Multimodal

架构

Dense

许可证

Apache 2.0

发布日期

2 Apr 2026

训练数据截止日期

-

技术规格

注意力

注意力结构

Grouped-Query Attention

注意力头

8

键值头

2

注意力头维度

256

位置嵌入

ROPE

RoPE Theta

10,000

滑动窗口注意力

Yes

滑动窗口大小

512

归一化

RMS Normalization

激活函数

GELU

维度

隐藏维度大小

10,240

层数

42

FFN 中间层大小(稠密层)

10,240

多 Token 预测头数

-

分词器

词汇量大小

262,144

架构图

Input TokensToken EmbeddingPosition: RoPEHidden: 10.2k · Context: 128k · Vocab: 262.1kx 42 layersRMSNormPre-AttentionGrouped-Query Attention8Q / 2KV heads · SW: 512Head dim: 256+RMSNormPre-FFNFeed-Forward NetworkGELUIntermediate: 10.2k+Final RMSNormOutput Logits

Gemma 4 E4B

Gemma 4 E4B 是一款针对边缘优化的模型,拥有 45 亿有效参数(采用逐层嵌入时为 80 亿),专为移动和边缘部署而设计。支持多模态输入(文本、图像、音频)并具备 128K 上下文窗口。在保持高效端侧执行的同时,提供了优于 E2B 的增强性能。具备思考模式和原生函数调用功能。

关于 Gemma 4

Gemma 4 is Google DeepMind's most advanced open model family, built from Gemini 3 research and technology. Featuring both Dense and Mixture-of-Experts (MoE) architectures, these multimodal models handle text, images, and audio (on smaller variants), with context windows up to 256K tokens. Designed for frontier-level performance across reasoning, coding, and agentic workflows, Gemma 4 delivers unprecedented intelligence-per-parameter from mobile devices to enterprise servers. Released under Apache 2.0 license.


其他 Gemma 4 模型

评估基准

没有可用的 Gemma 4 E4B 评估基准。

排名

排名

-

编程排名

-

模型完整性

总分

B

68 / 100

GPU 要求

完整计算器

选择模型权重的量化方法

上下文大小:1024 个令牌

1k
63k
125k

所需显存:

推荐 GPU