趋近智
参数
-
上下文长度
128K
模态
Multimodal
架构
Dense
许可证
Proprietary
发布日期
10 Jan 2026
训练数据截止日期
-
注意力结构
Multi-Head Attention
隐藏维度大小
-
层数
-
注意力头
-
键值头
-
激活函数
-
归一化
-
位置嵌入
Absolute Position Embedding
NVIDIA Optimus Alpha 提供优化的 AI 推理,重点关注效率和吞吐量。该模型具备针对 NVIDIA GPU 的硬件感知优化,支持在企业环境中进行高性能部署。它在需要持续高吞吐量且保持稳定低延迟的工作负载中表现出色,是需要在 NVIDIA 基础设施上实现大规模可靠性能的生产部署的理想选择。
NVIDIA Optimus Alpha 系列模型结合了先进的 AI 功能与软硬件协同优化技术。该系列专为企业级部署量身定制,旨在 NVIDIA 基础设施上实现高吞吐量、低延迟及高效的资源利用率。
排名
#65
| 基准 | 分数 | 排名 |
|---|---|---|
0.53 | 21 |
排名
#65
编程排名
#66