Grok 4.1 Fast

闭源

封闭权重

参数

上下文长度

128K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Jun 2025

训练数据截止日期

Jun 2025

评估基准

排名

#72

基准	分数	排名
研究生级问答 GPQA	0.857	8
推理 LiveBench Reasoning	0.80	14
数学 LiveBench Mathematics	0.84	16
专业知识 MMLU Pro	0.84	23
数据分析 LiveBench Data Analysis	0.52	31
编程 LiveBench Coding	0.70	38
智能编程 LiveBench Agentic	0.32	42
Web 开发 WebDev Arena	1234	92

排名

#72

编程排名

#117

关于 Grok 4.1 Fast

Grok 4.1 Fast 是由 xAI 推出的优化型大语言模型变体，专为高吞吐量、低延迟应用及复杂的智能体（agentic）工作流而设计。作为标准 Grok 4.1 系列的性能调优版，它提供了高达 200 万 token 的超长上下文窗口，能够摄取并处理海量文档、代码库以及长跨度的对话历史。该模型在架构上支持两种截然不同的运行模式：用于多步分析任务的推理模式（reasoning-enabled），以及用于近乎即时响应的非推理模式。

从技术角度看，该模型集成了专门的强化学习（RL）训练，重点强化了工具利用和长程规划能力。这一训练体系涵盖了金融、医疗和电信等多个企业领域的模拟环境，使模型能够通过 xAI Agent Tools API 编排外部工具。其架构旨在扩展上下文范围内保持高度的状态稳定性，利用先进的注意力机制确保事实的一致性，并比前代模型显著降低了幻觉率。

在实际部署中，Grok 4.1 Fast 被广泛应用于自主智能体、深度研究自动化以及实时客户支持系统。它原生支持多跳网页搜索、通过 X 生态系统进行实时数据检索以及远程代码执行。这使得它对于构建生产级智能体的开发者尤为高效，能够满足高速函数调用、结构化数据提取以及对外部知识源可靠对齐（grounding）的严苛需求。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

C-

47 / 100

上游

16.0 / 30

模型

17.0 / 40

下游

14.0 / 30

资源

官方文档

关于 Grok

xAI 的对话式 AI 模型系列，具备实时知识访问能力，在推理、编程和语言任务方面表现优异。其特点包括扩展的上下文窗口、快速推理变体以及专门的编程版本。该系列模型以直率的沟通风格以及与 X 平台的深度集成而著称，并包含推理变体和针对不同延迟需求优化的版本。