GPT-5 Pro

闭源

封闭权重

参数

上下文长度

400K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

7 Aug 2025

训练数据截止日期

Aug 2025

评估基准

排名

#21

基准	分数	排名
编程 Aider Coding	0.88	🥇 1
通用知识 MMLU	0.925	🥇 1
文本摘要 ProLLM Summarization	0.98	🥈 2
StackUnseen ProLLM Stack Unseen	0.88	7
研究生级问答 GPQA	0.857	8
专业知识 MMLU Pro	0.87	11
推理 LiveBench Reasoning	0.82	12
数学 LiveBench Mathematics	0.86	12
智能编程 LiveBench Agentic	0.52	17
数据分析 LiveBench Data Analysis	0.57	25
编程 LiveBench Coding	0.72	33
Web 开发 WebDev Arena	1339	62

排名

#21

编程排名

#19

关于 GPT-5 Pro

GPT-5 Pro 代表了 OpenAI 的前沿推理模型，旨在通过专门的强化思考框架解决极高复杂度的计算和逻辑挑战。与优先考虑即时 Token 生成的标准自回归模型不同，Pro 版本利用了复杂的内部路由系统和扩展的推理时计算（test-time compute）。这使得模型能够探索多条内部思维链（chain-of-thought）路径，并在确定最终输出前验证中间步骤。该系统专为高要求的企业级应用设计，包括自主软件工程、复杂的金融建模以及对结构完整性和事实准确性有极高要求的科学分析。

底层架构采用稠密、仅解码器（decoder-only）的 Transformer 结构，并集成了用于文本和图像处理的原生多模态能力。它通过 API 提供高达 400,000 Token 的海量上下文窗口，其中划分为支持约 272,000 个输入 Token 和 128,000 个输出 Token。这种超大内存容量使其能够吸收整个技术仓库或多卷文档，而不会丢失长期依赖关系。技术改进包括使用旋转位置嵌入（RoPE）和先进的注意力机制，以确保在整个上下文范围内保持近乎 100% 的信息召回率。

从开发角度看，GPT-5 Pro 引入了对“推理强度”（reasoning_effort）和“冗余度”（verbosity）的细粒度控制，使工程师能够在延迟与认知深度之间实现平衡。该模型针对智能体工作流（agentic workflows）进行了专门优化，在多步规划和复杂工具调用中展现出卓越的可靠性。它保持了适合专业环境的正式且结构化的语调，并作为专有服务通过 OpenAI API 和 ChatGPT Pro 订阅层级提供，通过统一的智能系统确保了高度的一致性和安全性。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

D+

40 / 100

上游

12.0 / 30

模型

16.0 / 40

下游

12.0 / 30

资源

官方文档

关于 GPT-5

OpenAI 最新一代语言模型，具备先进的推理能力，支持高达 400K token 的超长上下文窗口，并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式，在各项基准测试中表现卓越，并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力，并通 Codex 变体实现了业界领先的编程能力。