GPT-5.1 Codex

闭源

封闭权重

参数

上下文长度

400K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

Sep 2024

评估基准

排名

#45

基准	分数	排名
推理 LiveBench Reasoning	0.82	11
智能编程 LiveBench Agentic	0.53	13
数据分析 LiveBench Data Analysis	0.61	22
数学 LiveBench Mathematics	0.80	23
编程 LiveBench Coding	0.72	34
Web 开发 WebDev Arena	1329	69

排名

#45

编程排名

#80

关于 GPT-5.1 Codex

GPT-5.1 Codex 是 OpenAI 推出的一款专用大语言模型，专为高保真软件开发和代理式编程工作流而设计。该变体基于 GPT-5.1 基础模型构建，针对需要在复杂代码库中维持状态和连贯性的长程工程任务进行了优化。与通用模型不同，Codex 经过专门调优，可在开发环境中作为自主智能体运行，能够执行多文件重构、自主调试以及可能持续较长时间的测试驱动开发（TDD）周期。

该架构采用带有多头注意力机制（MHA）的稠密 Transformer 配置，支持高达 400,000 个 token 的超宽上下文窗口。该系列的一个主要创新是引入了会话压缩机制。当交互接近上下文限制时，模型会修剪其对话历史，同时保留关键的架构细节和逻辑，从而使其能够在超出标准硬件限制的任务中有效保持连贯性。该模型还配备了动态推理引擎，开发者可以通过 API 参数调整计算投入，以在延迟与特定问题所需的技术分析深度之间取得平衡。

在功能上，GPT-5.1 Codex 通过 Responses API 与现代开发工具链原生集成。它配备了诸如用于可靠代码修改的 apply_patch 等专用工具，以及用于在受控环境中执行终端命令的 shell 接口。这使得该模型在处理复杂的软件工程流水线（包括依赖管理、环境搭建和大规模架构迁移）时表现尤为出色。其训练目标优先考虑精准遵循开发者指令并生成简洁、生产就绪的代码，从而减少了技术响应中常见的讨好倾向（sycophancy）或语法幻觉等问题。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

33 / 100

上游

10.0 / 30

模型

13.0 / 40

下游

10.0 / 30

资源

官方文档发布说明

关于 GPT-5

OpenAI 最新一代语言模型，具备先进的推理能力，支持高达 400K token 的超长上下文窗口，并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式，在各项基准测试中表现卓越，并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力，并通 Codex 变体实现了业界领先的编程能力。