趋近智
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
GPT-5.4 是 OpenAI 为专业工作打造的最强大且最高效的前沿模型。它将推理、编程和智能体工作流(agentic workflows)方面的最新进展集成于单一模型之中。该模型具备源自 GPT-5.3-Codex 的行业领先编程能力、原生的顶尖计算机操作能力,以及在大型生态系统中经过改进的工具调用能力。它擅长处理涉及电子表格、演示文稿和文档的专业任务。在基准测试中,它在 GDPval 上达到了 83.0%,OSWorld-Verified 为 75.0%,BrowseComp 为 82.7%,SWE-Bench Pro 为 57.7%,MMMU Pro 为 81.2%。GPT-5.4 支持高达 272K 的上下文长度(实验性支持 1M),并实现了迄今为止 Token 效率最高的推理。
OpenAI 最新一代语言模型,具备先进的推理能力,支持高达 400K token 的超长上下文窗口,并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式,在各项基准测试中表现卓越,并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力,并通 Codex 变体实现了业界领先的编程能力。
排名
#5
| 基准 | 分数 | 排名 |
|---|---|---|
0.70 | 🥇 1 | |
0.94 | 🥇 1 | |
0.79 | 🥇 1 | |
0.88 | 🥈 2 | |
专业知识 MMLU Pro | 0.87 | ⭐ 6 |
APX AI
在线