ApX 标志ApX 标志

趋近智

Claude Sonnet 4.5

参数

-

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

29 Sept 2025

训练数据截止日期

Jan 2025

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

-

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

Claude Sonnet 4.5

Claude 4.5 Sonnet 是由 Anthropic 开发的一款中端前沿模型,旨在实现高阶推理能力与运行效率之间的精妙平衡。作为生产力支柱,它专门针对复杂的智能体工作流、大规模软件工程以及复杂的计算机操作任务进行了优化。该模型是自主系统的核心组件,支持长时间运行的操作,并高度强调在各种专业领域中的可靠性和指令遵循准确度。

其底层架构采用基于稠密 Transformer 的框架,并集成了一个混合推理系统。该系统支持两种不同的执行模式:用于快速交互的标准低延迟模式,以及能够展示模型内部推理过程以解决更困难问题的扩展思考模式。它在正式版中提供 20 万 token 的超大上下文窗口,并为处理海量数据集、整个代码库或详尽的研究文档提供 100 万 token 的专用测试版容量。绝对位置嵌入和多头注意力机制的应用确保了在这些长序列上的稳定性能。

在技术层面,该模型引入了诸如并行工具执行等先进功能,使智能体能够在单次对话回合中执行多项操作,例如同时执行多个 Shell 命令。它原生集成了模型上下文协议 (MCP),并支持特定的开发者工具,如用于状态管理的检查点 (checkpoints) 和用于精确记忆控制的上下文编辑。这些特性使其特别适用于金融、法律和网络安全等领域的企业级应用,在这些领域中,执行多步骤、关键性任务需要持续的专注力和深厚的领域知识。

关于 Claude 4.5

增强型 Claude 模型,在推理、编程和智能体能力(agentic capabilities)方面进行了进一步改进。具备先进的思考模式,提供可调节的投入程度(高、中、标准),以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体,以提高透明度。


其他 Claude 4.5 模型

评估基准

排名

#83

基准分数排名

0.76

16

0.694

16

研究生级问答

GPQA

0.834

16

0.56

18

智能编程

LiveBench Agentic

0.48

21

通用文本

Text Arena

1454

22

Web 开发

WebDev Arena

1386

43

0.47

46

0.63

49

0.42

51

排名

排名

#83

编程排名

#47

模型完整性

总分

D

38 / 100