ApX 标志ApX 标志

趋近智

Grok 4.1 Fast

参数

-

上下文长度

128K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Jun 2025

训练数据截止日期

Jun 2025

评估基准

排名

#72

基准分数排名

研究生级问答

GPQA

0.857

8

0.80

14

0.84

16

专业知识

MMLU Pro

0.84

23

0.52

31

0.70

38

智能编程

LiveBench Agentic

0.32

42

Web 开发

WebDev Arena

1234

92

排名

排名

#72

编程排名

#117

关于 Grok 4.1 Fast

Grok 4.1 Fast 是由 xAI 推出的优化型大语言模型变体,专为高吞吐量、低延迟应用及复杂的智能体(agentic)工作流而设计。作为标准 Grok 4.1 系列的性能调优版,它提供了高达 200 万 token 的超长上下文窗口,能够摄取并处理海量文档、代码库以及长跨度的对话历史。该模型在架构上支持两种截然不同的运行模式:用于多步分析任务的推理模式(reasoning-enabled),以及用于近乎即时响应的非推理模式。

从技术角度看,该模型集成了专门的强化学习(RL)训练,重点强化了工具利用和长程规划能力。这一训练体系涵盖了金融、医疗和电信等多个企业领域的模拟环境,使模型能够通过 xAI Agent Tools API 编排外部工具。其架构旨在扩展上下文范围内保持高度的状态稳定性,利用先进的注意力机制确保事实的一致性,并比前代模型显著降低了幻觉率。

在实际部署中,Grok 4.1 Fast 被广泛应用于自主智能体、深度研究自动化以及实时客户支持系统。它原生支持多跳网页搜索、通过 X 生态系统进行实时数据检索以及远程代码执行。这使得它对于构建生产级智能体的开发者尤为高效,能够满足高速函数调用、结构化数据提取以及对外部知识源可靠对齐(grounding)的严苛需求。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

-

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

模型完整性

总分

C-

47 / 100

关于 Grok

xAI 的对话式 AI 模型系列,具备实时知识访问能力,在推理、编程和语言任务方面表现优异。其特点包括扩展的上下文窗口、快速推理变体以及专门的编程版本。该系列模型以直率的沟通风格以及与 X 平台的深度集成而著称,并包含推理变体和针对不同延迟需求优化的版本。


其他 Grok 模型