趋近智
参数
-
上下文长度
1,000K
模态
Multimodal
架构
Dense
许可证
Proprietary
发布日期
17 Feb 2026
训练数据截止日期
Aug 2025
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
4,096
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
Claude Sonnet 4.6 是一款多模态基础模型,专为高性能智能体工作流、复杂软件工程和大规模文档分析而设计。作为 Claude 4 模型系列的核心组件,它采用了稠密 Transformer 架构,旨在平衡计算效率与高阶推理能力。该模型被专门设计为企业自动化的通用型主力工具,支持诸如图形用户界面(GUI)自主导航和多步智能体规划等高级任务。
从技术角度看,该模型引入了多项架构创新,包括处于 Beta 阶段的 100 万 token 上下文窗口,支持在单次推理过程中处理庞大的代码库和多文档数据集。它采用了混合推理框架,支持自适应思考和扩展思考模式,允许模型针对复杂问题动态分配内部处理 token。此外,引入的上下文压缩技术可在接近架构限制时,通过总结历史背景来高效管理长期对话。
在性能表现上,该模型在“计算机使用能力”(computer use)方面取得了显著进展,在与网页浏览器、电子表格等标准软件环境交互时展现出人类水平的熟练度。它针对软件开发生命周期进行了深度优化,具备精准的指令遵循能力,并有效减少了常见的过度设计或输出延迟。该模型通过 Anthropic API 及各大主流云平台部署,为需要在高容量生产应用中使用前沿智能的开发者提供了可扩展的解决方案。
Anthropic 的第四代 Claude 模型,具备先进的推理能力、高达 200K token 的扩展上下文窗口以及可配置的思考强度等级。其特点包括改进的安全对齐、细致入微的理解能力和卓越的任务完成能力。该系列包含 Opus(性能最强)、Sonnet(平衡型)和 Haiku(快速型)三种版本,并提供思考模式以实现针对复杂问题的透明思维链推理。
排名
#22
| 基准 | 分数 | 排名 |
|---|---|---|
StackUnseen ProLLM Stack Unseen | 0.89 | ⭐ 4 |
Web 开发 WebDev Arena | 1523 | ⭐ 5 |
0.78 | ⭐ 6 | |
专业知识 MMLU Pro | 0.87 | ⭐ 8 |
研究生级问答 GPQA | 0.75 | 37 |
APX AI
在线