Claude Sonnet 4.6

闭源

封闭权重

参数

上下文长度

模态

Multimodal

架构

Dense

许可证

Proprietary

发布日期

17 Feb 2026

训练数据截止日期

Aug 2025

评估基准

排名

#29

基准	分数	排名
StackUnseen ProLLM Stack Unseen	0.89	⭐ 4
数据分析 LiveBench Data Analysis	0.78	⭐ 6
专业知识 MMLU Pro	0.87	⭐ 8
Web 开发 WebDev Arena	1523	⭐ 9
通用文本 Text Arena	1461	17
研究生级问答 GPQA	0.75	37

排名

#29

编程排名

关于 Claude Sonnet 4.6

Claude Sonnet 4.6 是一款多模态基础模型，专为高性能智能体工作流、复杂软件工程和大规模文档分析而设计。作为 Claude 4 模型系列的核心组件，它采用了稠密 Transformer 架构，旨在平衡计算效率与高阶推理能力。该模型被专门设计为企业自动化的通用型主力工具，支持诸如图形用户界面（GUI）自主导航和多步智能体规划等高级任务。

从技术角度看，该模型引入了多项架构创新，包括处于 Beta 阶段的 100 万 token 上下文窗口，支持在单次推理过程中处理庞大的代码库和多文档数据集。它采用了混合推理框架，支持自适应思考和扩展思考模式，允许模型针对复杂问题动态分配内部处理 token。此外，引入的上下文压缩技术可在接近架构限制时，通过总结历史背景来高效管理长期对话。

在性能表现上，该模型在“计算机使用能力”（computer use）方面取得了显著进展，在与网页浏览器、电子表格等标准软件环境交互时展现出人类水平的熟练度。它针对软件开发生命周期进行了深度优化，具备精准的指令遵循能力，并有效减少了常见的过度设计或输出延迟。该模型通过 Anthropic API 及各大主流云平台部署，为需要在高容量生产应用中使用前沿智能的开发者提供了可扩展的解决方案。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

4,096

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

D+

41 / 100

上游

13.0 / 30

模型

16.0 / 40

下游

12.0 / 30

资源

官方文档发布说明

关于 Claude 4

Anthropic 的第四代 Claude 模型，具备先进的推理能力、高达 200K token 的扩展上下文窗口以及可配置的思考强度等级。其特点包括改进的安全对齐、细致入微的理解能力和卓越的任务完成能力。该系列包含 Opus（性能最强）、Sonnet（平衡型）和 Haiku（快速型）三种版本，并提供思考模式以实现针对复杂问题的透明思维链推理。