趋近智
参数
-
上下文长度
200K
模态
Multimodal
架构
Dense
许可证
Proprietary
发布日期
19 Feb 2025
训练数据截止日期
-
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
Claude 3.7 Sonnet (claude-3-7-sonnet-20250219) 在成功的 Claude 3.5 架构基础上提供了更精进的能力。其特点包括更强的推理能力、对软件模式理解更深的增强型代码辅助,以及更可靠的输出。它在内容生成、分析、客户服务及开发辅助等生产级应用中表现优异,并实现了强大功能与高性价比之间的平衡,非常适合持续的企业级部署。
Claude 3.7 Sonnet 基于 Claude 3.5 架构构建,并针对生产级用例优化了各项能力。它提供了增强的推理能力、编程辅助和多语言支持,重点关注企业级部署的可靠性与成本效益。
排名
#45
| 基准 | 分数 | 排名 |
|---|---|---|
StackEval ProLLM Stack Eval | 0.966 | 6 |
QA 助手 ProLLM QA Assistant | 0.942 | 11 |
研究生级问答 GPQA | 0.848 | 11 |
0.65 | 12 | |
0.78 | 15 | |
专业知识 MMLU Pro | 0.83 | 29 |
APX AI
在线