趋近智
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
o4-mini 为成本敏感型应用带来了高效的推理能力。它比 o3 系列更紧凑,同时在推理任务上保持了稳健的性能。该模型在推理能力和性价比之间实现了卓越的平衡,使推理型 AI 能够应用于更广泛的使用场景。它在数学、编程挑战和结构化问题解决方面表现出色,是需要大规模深度分析的应用场景的理想选择。
o4-mini 系列将高效的推理能力引入更轻量化的规格,使先进的深思熟虑型 AI 更加普及。该系列针对高性价比部署进行了优化,同时在推理基准测试中保持了强劲性能,是需要大规模缜密分析的应用场景的理想选择。
排名
#59
| 基准 | 分数 | 排名 |
|---|---|---|
0.72 | 8 | |
研究生级问答 GPQA | 0.814 | 20 |
专业知识 MMLU Pro | 0.81 | 34 |
通用文本 Text Arena | 1390 | 57 |
APX AI
在线