GPT-5.1 No Thinking

闭源

封闭权重

参数

上下文长度

400K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

Sep 2024

评估基准

排名

#127

基准	分数	排名
编程 LiveBench Coding	0.77	12
专业知识 MMLU Pro	0.86	12
编程 Aider Coding	0.52	26
智能编程 LiveBench Agentic	0.28	46
数据分析 LiveBench Data Analysis	0.44	55
数学 LiveBench Mathematics	0.45	56
推理 LiveBench Reasoning	0.27	60
Web 开发 WebDev Arena	1340	61

排名

#127

编程排名

#52

关于 GPT-5.1 No Thinking

GPT-5.1 No Thinking 是一款专为延迟敏感型应用设计的高性能模型变体，旨在提供 GPT-5 世代广博的知识储备和卓越的指令遵循能力，同时免除扩展推理过程带来的开销。通过禁用主动的思维链（chain-of-thought）机制，该模型能够提供直接、高速的响应，适用于交互式用户界面和实时数据处理。它维持了复杂的模块化架构，利用稀疏混合专家（MoE）设计，确保计算资源在每个 token 级别上得到高效分配。

从技术角度看，该模型采用了从稠密到稀疏的转换，核心语言骨干由专门的专家层进行增强。虽然“No Thinking”配置限制了模型生成中间推理 token，但它沿用了与具备推理能力的变体相同的基础权重，在代码生成和文档提取等结构化任务中保持了强劲的性能。该变体专门针对确定性执行以及缩短首字响应时间（TTFT）优先于多步逻辑验证的场景进行了优化。

该模型作为旗舰级 GPT-5.1 模型的一个可配置状态集成到 OpenAI API 生态系统中，开发人员可以显式地将推理强度（reasoning effort）设置为零值。这种配置对于代理（agentic）工作流尤为有效，即由主控制器管理任务分解，并需要一个快速、可靠的执行单元来处理单个子任务。它支持诸如 24 小时留存的提示词缓存（prompt caching）和原生工具调用能力等高级特性，使其成为复杂软件工程和生产级自动化的多功能组件。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

34 / 100

上游

11.0 / 30

模型

14.0 / 40

下游

9.0 / 30

资源

官方文档发布说明

关于 GPT-5

OpenAI 最新一代语言模型，具备先进的推理能力，支持高达 400K token 的超长上下文窗口，并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式，在各项基准测试中表现卓越，并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力，并通 Codex 变体实现了业界领先的编程能力。