ApX 标志ApX 标志

趋近智

GPT-5.1 Codex

参数

-

上下文长度

400K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

13 Nov 2025

训练数据截止日期

Sep 2024

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

-

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

GPT-5.1 Codex

GPT-5.1 Codex 是 OpenAI 推出的一款专用大语言模型,专为高保真软件开发和代理式编程工作流而设计。该变体基于 GPT-5.1 基础模型构建,针对需要在复杂代码库中维持状态和连贯性的长程工程任务进行了优化。与通用模型不同,Codex 经过专门调优,可在开发环境中作为自主智能体运行,能够执行多文件重构、自主调试以及可能持续较长时间的测试驱动开发(TDD)周期。

该架构采用带有多头注意力机制(MHA)的稠密 Transformer 配置,支持高达 400,000 个 token 的超宽上下文窗口。该系列的一个主要创新是引入了会话压缩机制。当交互接近上下文限制时,模型会修剪其对话历史,同时保留关键的架构细节和逻辑,从而使其能够在超出标准硬件限制的任务中有效保持连贯性。该模型还配备了动态推理引擎,开发者可以通过 API 参数调整计算投入,以在延迟与特定问题所需的技术分析深度之间取得平衡。

在功能上,GPT-5.1 Codex 通过 Responses API 与现代开发工具链原生集成。它配备了诸如用于可靠代码修改的 apply_patch 等专用工具,以及用于在受控环境中执行终端命令的 shell 接口。这使得该模型在处理复杂的软件工程流水线(包括依赖管理、环境搭建和大规模架构迁移)时表现尤为出色。其训练目标优先考虑精准遵循开发者指令并生成简洁、生产就绪的代码,从而减少了技术响应中常见的讨好倾向(sycophancy)或语法幻觉等问题。

关于 GPT-5

OpenAI 最新一代语言模型,具备先进的推理能力,支持高达 400K token 的超长上下文窗口,并针对编程、通用智能及效率推出了专门的变体。GPT-5 系列引入了改进的思考模式,在各项基准测试中表现卓越,并提供从高容量 Pro 模型到高效 Nano 模型等多种针对不同用例优化的版本。该系列具备原生多模态理解能力、增强的数学推理能力,并通 Codex 变体实现了业界领先的编程能力。


其他 GPT-5 模型

评估基准

排名

#45

基准分数排名

0.82

11

智能编程

LiveBench Agentic

0.53

13

0.61

22

0.80

23

0.72

34

Web 开发

WebDev Arena

1329

69

排名

排名

#45

编程排名

#80

模型完整性

总分

F

33 / 100