趋近智
排名
#84
| 基准 | 分数 | 排名 |
|---|---|---|
通用文本 Text Arena | 1460 | 18 |
专业知识 MMLU Pro | 0.84 | 23 |
0.32 | 42 | |
Web 开发 WebDev Arena | 1209 | 97 |
排名
#84
编程排名
#112
Grok 4.1 在实际可用性方面带来了显著提升,具备卓越的创意、情感和协作能力。该版本利用前沿的智能体推理模型作为奖励模型,针对风格、个性、有用性和对齐进行了优化。它在 LMArena 文本排行榜上表现出色,思考模式以 1483 Elo 分位居榜首,非思考模式以 1465 Elo 分位列第二,超越了所有其他模型。其特性包括 200 万 (2M) 上下文窗口、幻觉率大幅降低(在生产环境查询中从 12.09% 降至 4.22%),以及业内顶尖的情感智能(在 EQ-Bench 上达到 1586 Elo)。用户可通过 API 调用其推理模式和快速非推理模式。
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
APX AI
在线