GPT-5.4

闭源

封闭权重

参数

上下文长度

272K

模态

Multimodal

架构

Dense

许可证

Proprietary

发布日期

5 Mar 2026

训练数据截止日期

评估基准

排名

基准	分数	排名
智能编程 LiveBench Agentic	0.70	🥇 1
数学 LiveBench Mathematics	0.94	🥇 1
数据分析 LiveBench Data Analysis	0.79	🥇 1
推理 LiveBench Reasoning	0.88	🥈 2
专业知识 MMLU Pro	0.87	⭐ 6
通用文本 Text Arena	1468	⭐ 13
Web 开发 WebDev Arena	1457	19

排名

编程排名

#42

关于 GPT-5.4

GPT-5.4 是 OpenAI 为专业工作打造的最强大且最高效的前沿模型。它将推理、编程和智能体工作流（agentic workflows）方面的最新进展集成于单一模型之中。该模型具备源自 GPT-5.3-Codex 的行业领先编程能力、原生的顶尖计算机操作能力，以及在大型生态系统中经过改进的工具调用能力。它擅长处理涉及电子表格、演示文稿和文档的专业任务。在基准测试中，它在 GDPval 上达到了 83.0%，OSWorld-Verified 为 75.0%，BrowseComp 为 82.7%，SWE-Bench Pro 为 57.7%，MMMU Pro 为 81.2%。GPT-5.4 支持高达 272K 的上下文长度（实验性支持 1M），并实现了迄今为止 Token 效率最高的推理。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

35 / 100

上游

10.0 / 30

模型

15.0 / 40

下游

10.0 / 30

资源

官方文档

关于 GPT-5

OpenAI 最新一代语言模型，具备先进的推理能力，支持高达 400K token 的超长上下文窗口，并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式，在各项基准测试中表现卓越，并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力，并通 Codex 变体实现了业界领先的编程能力。