趋近智
参数
-
上下文长度
131K
模态
Text
架构
Dense
许可证
Proprietary
发布日期
13 Nov 2025
训练数据截止日期
May 2024
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
GPT-5 Nano 是 GPT-5 家族中最紧凑、最高效的成员,专为将低延迟和高吞吐量作为主要工程约束的环境而设计。与体量较大的同类模型不同,Nano 经过专门的架构设计,旨在支持快速的实时交互和轻量级智能体(agentic)任务。它作为统一路由系统的一部分运行,该系统能够动态分配计算资源,使模型在保持 GPT-5 系列特有的指令遵循精度的同时,作为处理常规分类、基础摘要和高频 API 调用的快速响应引擎。
从技术角度看,该模型采用了针对边缘就绪部署和高性价比扩展进行优化的稠密 Transformer 架构。它引入了可变的推理力度级别(包括极小、低、中、高),允许开发人员为每个请求灵活权衡推理速度与认知深度。这种灵活性由扩展至 400,000 token 的上下文窗口提供支持,使得该模型尽管参数规模较小,仍能处理大规模文档集或冗长的对话历史。此外,该架构还集成了多模态输入支持,能够在同一次推理过程中原生处理文本和图像数据。
在运营层面,GPT-5 Nano 被定位为上一代轻量级模型的替代产品,为大规模工作负载提供了显著降低的价格点。它针对开发者工具、移动应用以及对资源效率有硬性要求的低功耗设备进行了优化。通过优先提升吞吐量,并利用高保真数据集进行精细化训练以降低幻觉频率,该模型为构建在大规模部署中需保持一致性能的响应式 AI 服务奠定了可靠基础。
OpenAI 最新一代语言模型,具备先进的推理能力,支持高达 400K token 的超长上下文窗口,并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式,在各项基准测试中表现卓越,并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力,并通 Codex 变体实现了业界领先的编程能力。
排名
#120
| 基准 | 分数 | 排名 |
|---|---|---|
0.954 | 5 | |
StackEval ProLLM Stack Eval | 0.95 | 10 |
StackUnseen ProLLM Stack Unseen | 0.604 | 20 |
0.09 | 35 | |
专业知识 MMLU Pro | 0.76 | 44 |
0.67 | 45 | |
0.28 | 46 | |
0.44 | 54 |
APX AI
在线