ApX 标志ApX 标志

趋近智

GPT-5.1 No Thinking

参数

-

上下文长度

400K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

Sep 2024

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

-

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

GPT-5.1 No Thinking

GPT-5.1 No Thinking 是一款专为延迟敏感型应用设计的高性能模型变体,旨在提供 GPT-5 世代广博的知识储备和卓越的指令遵循能力,同时免除扩展推理过程带来的开销。通过禁用主动的思维链(chain-of-thought)机制,该模型能够提供直接、高速的响应,适用于交互式用户界面和实时数据处理。它维持了复杂的模块化架构,利用稀疏混合专家(MoE)设计,确保计算资源在每个 token 级别上得到高效分配。

从技术角度看,该模型采用了从稠密到稀疏的转换,核心语言骨干由专门的专家层进行增强。虽然“No Thinking”配置限制了模型生成中间推理 token,但它沿用了与具备推理能力的变体相同的基础权重,在代码生成和文档提取等结构化任务中保持了强劲的性能。该变体专门针对确定性执行以及缩短首字响应时间(TTFT)优先于多步逻辑验证的场景进行了优化。

该模型作为旗舰级 GPT-5.1 模型的一个可配置状态集成到 OpenAI API 生态系统中,开发人员可以显式地将推理强度(reasoning effort)设置为零值。这种配置对于代理(agentic)工作流尤为有效,即由主控制器管理任务分解,并需要一个快速、可靠的执行单元来处理单个子任务。它支持诸如 24 小时留存的提示词缓存(prompt caching)和原生工具调用能力等高级特性,使其成为复杂软件工程和生产级自动化的多功能组件。

关于 GPT-5

OpenAI 最新一代语言模型,具备先进的推理能力,支持高达 400K token 的超长上下文窗口,并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式,在各项基准测试中表现卓越,并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力,并通 Codex 变体实现了业界领先的编程能力。


其他 GPT-5 模型

评估基准

排名

#127

基准分数排名

0.77

12

专业知识

MMLU Pro

0.86

12

0.52

26

智能编程

LiveBench Agentic

0.28

46

0.44

55

0.45

56

0.27

60

Web 开发

WebDev Arena

1340

61

排名

排名

#127

编程排名

#52

模型完整性

总分

F

34 / 100