ApX 标志

趋近智

GPT-OSS 120B

活跃参数

117B

上下文长度

128K

模态

Text

架构

Mixture of Experts (MoE)

许可证

Apache 2.0

发布日期

5 Aug 2025

知识截止

Jun 2024

技术规格

专家参数总数

5.1B

专家数量

128

活跃专家

4

注意力结构

Multi-Head Attention

隐藏维度大小

2880

层数

36

注意力头

-

键值头

-

激活函数

SwigLU

归一化

RMS Normalization

位置嵌入

Absolute Position Embedding

系统要求

不同量化方法和上下文大小的显存要求

GPT-OSS 120B

GPT-OSS 120B is a large open-weight model from OpenAI, designed to operate in data centers and on high-end desktops and laptops. It is developed to support advanced reasoning, agentic tasks, and diverse developer use cases, functioning as a text-only model for both input and output modalities.

关于 GPT-OSS

Open-weight language models from OpenAI.


其他 GPT-OSS 模型

评估基准

排名适用于本地LLM。

排名

#5

基准分数排名

0.79

🥇

1

0.93

🥇

1

0.78

6

Web Development

WebDev Arena

1081.54

6

Agentic Coding

LiveBench Agentic

0.10

10

0.59

11

0.70

11

0.57

13

排名

排名

#5

编程排名

#1 🥇

GPU 要求

完整计算器

选择模型权重的量化方法

上下文大小:1024 个令牌

1k
63k
125k

所需显存:

推荐 GPU