GPT-5 Nano High

闭源

封闭权重

参数

上下文长度

131K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

May 2024

评估基准

排名

#107

基准	分数	排名
数学 LiveBench Mathematics	0.68	39
推理 LiveBench Reasoning	0.40	54
Web 开发 WebDev Arena	1338	63
通用文本 Text Arena	1337	72

排名

#107

编程排名

#72

关于 GPT-5 Nano High

GPT-5 Nano High 变体代表了 OpenAI 第五代模型架构中的一种优化配置，专门设计用于平衡计算效率与复杂推理能力。虽然标准版 Nano 模型作为高吞吐量任务的轻量级入口，但 High 变体引入了专门的推理配置，使系统能够在推理阶段分配额外的计算资源。这种配置允许模型处理需要多步逻辑和精确指令遵循的任务，而不会产生与前沿模型相关的巨大开销。

从技术角度来看，该模型采用了以多头注意力和绝对位置嵌入为特征的稠密 Transformer 架构。其实现重点在于最大化 Token 处理速度，为交互式开发环境和即时响应系统等延迟敏感型应用实现高吞吐量。通过支持扩展至 400,000 个 Token 的上下文窗口，该模型可以有效处理大规模代码库或冗长的技术文档，确保长距离依赖下的上下文一致性。

该模型主要面向在资源受限环境或高频流水线中实现智能特性的技术专业人员。它在自动代码审查、常规行政自动化以及作为代理工作流（agentic workflows）中的推理层方面表现尤为出色。通过降低单位 Token 成本并提供高推理模式，该变体为需要在技术、科学和多语言领域保持可靠准确性的规模化服务提供了一种具备高性价比的解决方案。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

D+

43 / 100

上游

15.0 / 30

模型

16.0 / 40

下游

12.0 / 30

资源

官方文档

关于 GPT-5

OpenAI 最新一代语言模型，具备先进的推理能力，支持高达 400K token 的超长上下文窗口，并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式，在各项基准测试中表现卓越，并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力，并通 Codex 变体实现了业界领先的编程能力。