GPT-5 Nano

闭源

封闭权重

参数

上下文长度

131K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

May 2024

评估基准

排名

#120

基准	分数	排名
文本摘要 ProLLM Summarization	0.954	5
StackEval ProLLM Stack Eval	0.95	10
StackUnseen ProLLM Stack Unseen	0.604	20
编程 Aider Coding	0.09	35
专业知识 MMLU Pro	0.76	44
编程 LiveBench Coding	0.67	45
智能编程 LiveBench Agentic	0.28	46
数据分析 LiveBench Data Analysis	0.44	54

排名

#120

编程排名

#135

关于 GPT-5 Nano

GPT-5 Nano 是 GPT-5 家族中最紧凑、最高效的成员，专为将低延迟和高吞吐量作为主要工程约束的环境而设计。与体量较大的同类模型不同，Nano 经过专门的架构设计，旨在支持快速的实时交互和轻量级智能体（agentic）任务。它作为统一路由系统的一部分运行，该系统能够动态分配计算资源，使模型在保持 GPT-5 系列特有的指令遵循精度的同时，作为处理常规分类、基础摘要和高频 API 调用的快速响应引擎。

从技术角度看，该模型采用了针对边缘就绪部署和高性价比扩展进行优化的稠密 Transformer 架构。它引入了可变的推理力度级别（包括极小、低、中、高），允许开发人员为每个请求灵活权衡推理速度与认知深度。这种灵活性由扩展至 400,000 token 的上下文窗口提供支持，使得该模型尽管参数规模较小，仍能处理大规模文档集或冗长的对话历史。此外，该架构还集成了多模态输入支持，能够在同一次推理过程中原生处理文本和图像数据。

在运营层面，GPT-5 Nano 被定位为上一代轻量级模型的替代产品，为大规模工作负载提供了显著降低的价格点。它针对开发者工具、移动应用以及对资源效率有硬性要求的低功耗设备进行了优化。通过优先提升吞吐量，并利用高保真数据集进行精细化训练以降低幻觉频率，该模型为构建在大规模部署中需保持一致性能的响应式 AI 服务奠定了可靠基础。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

38 / 100

上游

13.0 / 30

模型

14.0 / 40

下游

11.0 / 30

资源

官方文档

关于 GPT-5

OpenAI 最新一代语言模型，具备先进的推理能力，支持高达 400K token 的超长上下文窗口，并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式，在各项基准测试中表现卓越，并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力，并通 Codex 变体实现了业界领先的编程能力。