ApX 标志ApX 标志

趋近智

GPT-OSS 120B

活跃参数

117B

上下文长度

128K

模态

Text

架构

Mixture of Experts (MoE)

许可证

Apache 2.0

发布日期

5 Aug 2025

训练数据截止日期

Jun 2024

技术规格

专家参数总数

5.1B

专家数量

128

活跃专家

4

注意力结构

Multi-Head Attention

隐藏维度大小

2880

层数

36

注意力头

-

键值头

-

激活函数

SwigLU

归一化

RMS Normalization

位置嵌入

Absolute Position Embedding

GPT-OSS 120B

GPT-OSS 120B is a large open-weight model from OpenAI, designed to operate in data centers and on high-end desktops and laptops. It is developed to support advanced reasoning, agentic tasks, and diverse developer use cases, functioning as a text-only model for both input and output modalities.

关于 GPT-OSS

Open-weight language models from OpenAI.


其他 GPT-OSS 模型

评估基准

排名

#78

基准分数排名

0.98

🥇

1

General Knowledge

MMLU

0.90

🥈

2

0.42

6

Professional Knowledge

MMLU Pro

0.81

11

Graduate-Level QA

GPQA

0.8

17

0.69

26

Web Development

WebDev Arena

1354

28

Agentic Coding

LiveBench Agentic

0.17

34

0.39

37

0.60

41

0.57

43

排名

排名

#78

编程排名

#78

模型透明度

总分

B

67 / 100

GPU 要求

完整计算器

选择模型权重的量化方法

上下文大小:1024 个令牌

1k
63k
125k

所需显存:

推荐 GPU