趋近智
参数
-
上下文长度
400K
模态
Text
架构
Dense
许可证
Proprietary
发布日期
13 Nov 2025
训练数据截止日期
Sep 2024
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
GPT-5.1 No Thinking 是一款专为延迟敏感型应用设计的高性能模型变体,旨在提供 GPT-5 世代广博的知识储备和卓越的指令遵循能力,同时免除扩展推理过程带来的开销。通过禁用主动的思维链(chain-of-thought)机制,该模型能够提供直接、高速的响应,适用于交互式用户界面和实时数据处理。它维持了复杂的模块化架构,利用稀疏混合专家(MoE)设计,确保计算资源在每个 token 级别上得到高效分配。
从技术角度看,该模型采用了从稠密到稀疏的转换,核心语言骨干由专门的专家层进行增强。虽然“No Thinking”配置限制了模型生成中间推理 token,但它沿用了与具备推理能力的变体相同的基础权重,在代码生成和文档提取等结构化任务中保持了强劲的性能。该变体专门针对确定性执行以及缩短首字响应时间(TTFT)优先于多步逻辑验证的场景进行了优化。
该模型作为旗舰级 GPT-5.1 模型的一个可配置状态集成到 OpenAI API 生态系统中,开发人员可以显式地将推理强度(reasoning effort)设置为零值。这种配置对于代理(agentic)工作流尤为有效,即由主控制器管理任务分解,并需要一个快速、可靠的执行单元来处理单个子任务。它支持诸如 24 小时留存的提示词缓存(prompt caching)和原生工具调用能力等高级特性,使其成为复杂软件工程和生产级自动化的多功能组件。
OpenAI 最新一代语言模型,具备先进的推理能力,支持高达 400K token 的超长上下文窗口,并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式,在各项基准测试中表现卓越,并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力,并通 Codex 变体实现了业界领先的编程能力。
排名
#127
| 基准 | 分数 | 排名 |
|---|---|---|
0.77 | 12 | |
专业知识 MMLU Pro | 0.86 | 12 |
0.52 | 26 | |
0.28 | 46 | |
0.44 | 55 | |
0.45 | 56 | |
0.27 | 60 | |
Web 开发 WebDev Arena | 1340 | 61 |
APX AI
在线