GPT-5.2 No Thinking

闭源

封闭权重

参数

上下文长度

400K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

Aug 2025

评估基准

排名

#89

基准	分数	排名
编程 Aider Coding	0.81	⭐ 4
编程 LiveBench Coding	0.76	14
专业知识 MMLU Pro	0.86	14
智能编程 LiveBench Agentic	0.40	31
数据分析 LiveBench Data Analysis	0.48	43
推理 LiveBench Reasoning	0.43	49
数学 LiveBench Mathematics	0.58	52

排名

#89

编程排名

关于 GPT-5.2 No Thinking

GPT-5.2 No Thinking 代表了 OpenAI 旗舰系列的延迟优化配置，专门设计用于通过跳过 Thinking 和 Pro 变体特有的内部思维链 (CoT) 处理来提供即时响应。作为专为专业知识工作和智能体工作流设计的更广泛模型生态系统的一部分，该变体在保持高保真输出的同时，实现了实时交互所需的计算效率。它支持与主系列相同的海量输入容量，允许在单次推理过程中处理大量代码库和技术文档。

其底层架构采用稠密 Transformer 配置，并结合了多头注意力 (MHA) 和绝对位置嵌入。这种设计使其能够精确处理长上下文依赖关系，而无需动态专家路由的额外开销。该模型针对工业级软件工程和结构化数据任务进行了特别优化，具有通过 Responses API 实现的高级工具调用能力。它还包含了上下文管理的技术改进，例如专门的压缩端点，可压缩冗长的对话历史，在防止上下文窗口饱和的同时保持语义完整性。

在实际应用中，该模型可作为高吞吐量引擎，助力开发者构建用户体验取决于极低首字延迟 (time-to-first-token) 的响应式工具。虽然它具备 GPT-5.2 系列广泛的知识截止日期和多模态输入能力，但由于缺乏显式的推理阶段，它在逻辑路径明确或已由提示词提供的任务中最为有效。它常被部署于大规模代码重构、技术文档摘要及交互式智能体系统等场景，在这些场景中，速度和可靠性相较于深度的多步深思熟虑具有更高优先级。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

27 / 100

上游

8.0 / 30

模型

11.0 / 40

下游

8.0 / 30

资源

官方文档发布说明

关于 GPT-5

OpenAI 最新一代语言模型，具备先进的推理能力，支持高达 400K token 的超长上下文窗口，并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式，在各项基准测试中表现卓越，并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力，并通 Codex 变体实现了业界领先的编程能力。