趋近智
参数
-
上下文长度
200K
模态
Text
架构
Dense
许可证
Proprietary
发布日期
29 Sept 2025
训练数据截止日期
Jan 2025
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
Claude 4.5 Sonnet 是由 Anthropic 开发的一款中端前沿模型,旨在实现高阶推理能力与运行效率之间的精妙平衡。作为生产力支柱,它专门针对复杂的智能体工作流、大规模软件工程以及复杂的计算机操作任务进行了优化。该模型是自主系统的核心组件,支持长时间运行的操作,并高度强调在各种专业领域中的可靠性和指令遵循准确度。
其底层架构采用基于稠密 Transformer 的框架,并集成了一个混合推理系统。该系统支持两种不同的执行模式:用于快速交互的标准低延迟模式,以及能够展示模型内部推理过程以解决更困难问题的扩展思考模式。它在正式版中提供 20 万 token 的超大上下文窗口,并为处理海量数据集、整个代码库或详尽的研究文档提供 100 万 token 的专用测试版容量。绝对位置嵌入和多头注意力机制的应用确保了在这些长序列上的稳定性能。
在技术层面,该模型引入了诸如并行工具执行等先进功能,使智能体能够在单次对话回合中执行多项操作,例如同时执行多个 Shell 命令。它原生集成了模型上下文协议 (MCP),并支持特定的开发者工具,如用于状态管理的检查点 (checkpoints) 和用于精确记忆控制的上下文编辑。这些特性使其特别适用于金融、法律和网络安全等领域的企业级应用,在这些领域中,执行多步骤、关键性任务需要持续的专注力和深厚的领域知识。
增强型 Claude 模型,在推理、编程和智能体能力(agentic capabilities)方面进行了进一步改进。具备先进的思考模式,提供可调节的投入程度(高、中、标准),以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体,以提高透明度。
排名
#83
| 基准 | 分数 | 排名 |
|---|---|---|
0.76 | 16 | |
StackUnseen ProLLM Stack Unseen | 0.694 | 16 |
研究生级问答 GPQA | 0.834 | 16 |
0.56 | 18 | |
0.48 | 21 | |
通用文本 Text Arena | 1454 | 22 |
Web 开发 WebDev Arena | 1386 | 43 |
0.47 | 46 | |
0.63 | 49 | |
0.42 | 51 |
APX AI
在线