Claude Sonnet 4.5

闭源

封闭权重

参数

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

29 Sept 2025

训练数据截止日期

Jan 2025

评估基准

排名

#83

基准	分数	排名
编程 LiveBench Coding	0.76	16
StackUnseen ProLLM Stack Unseen	0.694	16
研究生级问答 GPQA	0.834	16
编程 Aider Coding	0.56	18
智能编程 LiveBench Agentic	0.48	21
通用文本 Text Arena	1454	22
Web 开发 WebDev Arena	1386	43
数据分析 LiveBench Data Analysis	0.47	46
数学 LiveBench Mathematics	0.63	49
推理 LiveBench Reasoning	0.42	51

排名

#83

编程排名

#47

关于 Claude Sonnet 4.5

Claude 4.5 Sonnet 是由 Anthropic 开发的一款中端前沿模型，旨在实现高阶推理能力与运行效率之间的精妙平衡。作为生产力支柱，它专门针对复杂的智能体工作流、大规模软件工程以及复杂的计算机操作任务进行了优化。该模型是自主系统的核心组件，支持长时间运行的操作，并高度强调在各种专业领域中的可靠性和指令遵循准确度。

其底层架构采用基于稠密 Transformer 的框架，并集成了一个混合推理系统。该系统支持两种不同的执行模式：用于快速交互的标准低延迟模式，以及能够展示模型内部推理过程以解决更困难问题的扩展思考模式。它在正式版中提供 20 万 token 的超大上下文窗口，并为处理海量数据集、整个代码库或详尽的研究文档提供 100 万 token 的专用测试版容量。绝对位置嵌入和多头注意力机制的应用确保了在这些长序列上的稳定性能。

在技术层面，该模型引入了诸如并行工具执行等先进功能，使智能体能够在单次对话回合中执行多项操作，例如同时执行多个 Shell 命令。它原生集成了模型上下文协议 (MCP)，并支持特定的开发者工具，如用于状态管理的检查点 (checkpoints) 和用于精确记忆控制的上下文编辑。这些特性使其特别适用于金融、法律和网络安全等领域的企业级应用，在这些领域中，执行多步骤、关键性任务需要持续的专注力和深厚的领域知识。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

38 / 100

上游

10.0 / 30

模型

15.0 / 40

下游

13.0 / 30

资源

官方文档发布说明

关于 Claude 4.5

增强型 Claude 模型，在推理、编程和智能体能力（agentic capabilities）方面进行了进一步改进。具备先进的思考模式，提供可调节的投入程度（高、中、标准），以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体，以提高透明度。