趋近智
参数
-
上下文长度
128K
模态
Text
架构
Dense
许可证
Proprietary
发布日期
1 Jun 2025
训练数据截止日期
Jun 2025
排名
#72
| 基准 | 分数 | 排名 |
|---|---|---|
研究生级问答 GPQA | 0.857 | 8 |
0.80 | 14 | |
0.84 | 16 | |
专业知识 MMLU Pro | 0.84 | 23 |
0.52 | 31 | |
0.70 | 38 | |
0.32 | 42 | |
Web 开发 WebDev Arena | 1234 | 92 |
排名
#72
编程排名
#117
Grok 4.1 Fast 是由 xAI 推出的优化型大语言模型变体,专为高吞吐量、低延迟应用及复杂的智能体(agentic)工作流而设计。作为标准 Grok 4.1 系列的性能调优版,它提供了高达 200 万 token 的超长上下文窗口,能够摄取并处理海量文档、代码库以及长跨度的对话历史。该模型在架构上支持两种截然不同的运行模式:用于多步分析任务的推理模式(reasoning-enabled),以及用于近乎即时响应的非推理模式。
从技术角度看,该模型集成了专门的强化学习(RL)训练,重点强化了工具利用和长程规划能力。这一训练体系涵盖了金融、医疗和电信等多个企业领域的模拟环境,使模型能够通过 xAI Agent Tools API 编排外部工具。其架构旨在扩展上下文范围内保持高度的状态稳定性,利用先进的注意力机制确保事实的一致性,并比前代模型显著降低了幻觉率。
在实际部署中,Grok 4.1 Fast 被广泛应用于自主智能体、深度研究自动化以及实时客户支持系统。它原生支持多跳网页搜索、通过 X 生态系统进行实时数据检索以及远程代码执行。这使得它对于构建生产级智能体的开发者尤为高效,能够满足高速函数调用、结构化数据提取以及对外部知识源可靠对齐(grounding)的严苛需求。
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
xAI 的对话式 AI 模型系列,具备实时知识访问能力,在推理、编程和语言任务方面表现优异。其特点包括扩展的上下文窗口、快速推理变体以及专门的编程版本。该系列模型以直率的沟通风格以及与 X 平台的深度集成而著称,并包含推理变体和针对不同延迟需求优化的版本。
APX AI
在线