ApX 标志ApX 标志

趋近智

GPT-5 Nano

参数

-

上下文长度

131K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

May 2024

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

-

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

GPT-5 Nano

GPT-5 Nano 是 GPT-5 家族中最紧凑、最高效的成员,专为将低延迟和高吞吐量作为主要工程约束的环境而设计。与体量较大的同类模型不同,Nano 经过专门的架构设计,旨在支持快速的实时交互和轻量级智能体(agentic)任务。它作为统一路由系统的一部分运行,该系统能够动态分配计算资源,使模型在保持 GPT-5 系列特有的指令遵循精度的同时,作为处理常规分类、基础摘要和高频 API 调用的快速响应引擎。

从技术角度看,该模型采用了针对边缘就绪部署和高性价比扩展进行优化的稠密 Transformer 架构。它引入了可变的推理力度级别(包括极小、低、中、高),允许开发人员为每个请求灵活权衡推理速度与认知深度。这种灵活性由扩展至 400,000 token 的上下文窗口提供支持,使得该模型尽管参数规模较小,仍能处理大规模文档集或冗长的对话历史。此外,该架构还集成了多模态输入支持,能够在同一次推理过程中原生处理文本和图像数据。

在运营层面,GPT-5 Nano 被定位为上一代轻量级模型的替代产品,为大规模工作负载提供了显著降低的价格点。它针对开发者工具、移动应用以及对资源效率有硬性要求的低功耗设备进行了优化。通过优先提升吞吐量,并利用高保真数据集进行精细化训练以降低幻觉频率,该模型为构建在大规模部署中需保持一致性能的响应式 AI 服务奠定了可靠基础。

关于 GPT-5

OpenAI 最新一代语言模型,具备先进的推理能力,支持高达 400K token 的超长上下文窗口,并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式,在各项基准测试中表现卓越,并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力,并通 Codex 变体实现了业界领先的编程能力。


其他 GPT-5 模型

评估基准

排名

#120

基准分数排名

0.954

5

0.95

10

0.604

20

0.09

35

专业知识

MMLU Pro

0.76

44

0.67

45

智能编程

LiveBench Agentic

0.28

46

0.44

54

排名

排名

#120

编程排名

#135

模型完整性

总分

D

38 / 100