Claude 4.5 Opus Thinking

闭源

封闭权重

参数

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Nov 2025

训练数据截止日期

May 2025

评估基准

排名

#28

基准	分数	排名
推理 LiveBench Reasoning	0.82	8
专业知识 MMLU Pro	0.87	⭐ 9
通用文本 Text Arena	1473	⭐ 11
Web 开发 WebDev Arena	1490	⭐ 14

排名

#28

编程排名

#32

关于 Claude 4.5 Opus Thinking

Claude 4.5 Opus Thinking 代表了 Anthropic 旗舰级大语言模型的先进迭代版本，专门针对高要求推理、自主智能体编排和复杂软件工程而设计。该模型集成了一个混合推理引擎，允许开发者通过“effort”（努力程度）参数在计算深度与延迟之间取得平衡。通过启用扩展思考模式，模型在生成最终响应前会进行系统化的内部审议，这在处理多阶段规划、架构重构以及应对模糊的技术规范时尤为有效。

在技术层面，该模型基于经过优化的稠密 Transformer 架构，旨在确保长周期任务中的持续连贯性。它在状态管理方面引入了重大进展，包括支持在不同会话间实现持久化上下文的专用记忆工具，以及针对大规模 API 环境的高级工具发现机制。这些架构上的改进使系统能够专注于长周期目标，有效减少推理漂移，并确保在长时间的协作工作流中保持一致性。

在应用层面，该模型专为以准确性和结构完整性为核心要求的企业级应用而设计。它在跨文件代码库分析、涉及异构数据源的财务建模以及复杂的浏览器自动化任务中表现卓越。凭借巨大的上下文窗口和改进的 Token 效率特性，它为构建需要极少人工干预且决策过程高度透明的智能体系统奠定了坚实基础。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

RMS Normalization

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

35 / 100

上游

10.5 / 30

模型

15.5 / 40

下游

9.0 / 30

资源

官方文档发布说明阅读论文

关于 Claude 4.5

增强型 Claude 模型，在推理、编程和智能体能力（agentic capabilities）方面进行了进一步改进。具备先进的思考模式，提供可调节的投入程度（高、中、标准），以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体，以提高透明度。