ApX 标志ApX 标志

趋近智

Claude 4.5 Opus

参数

-

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Nov 2025

训练数据截止日期

May 2025

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

-

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

Claude 4.5 Opus

Claude 4.5 Opus 代表了 Claude 4.5 模型系列中的高性能层级,旨在以高度的自主性处理复杂推理和长程任务。该模型基于稠密 Transformer 架构构建,并采用混合推理系统,支持在不同计算强度水平下灵活执行。通过集成先进的工具使用能力和专门的计算机操作功能,该模型可作为多步智能体工作流和大规模软件工程项目的可靠编排器。

技术层面,该模型包含 200,000 token 的上下文窗口,其架构设计优先保障了长上下文检索和多文件代码重构的稳定性。底层训练方法结合了 AI 反馈强化学习 (RLAIF) 和大量的后训练,使模型输出符合以人为本的安全标准。诸如“effort”(努力度)参数等创新功能,让开发者能够对模型的内部思考过程进行细粒度控制,从而根据生产环境的具体需求优化延迟或准确性。

在实际应用中,Claude 4.5 Opus 专为金融建模、法律分析和自主系统管理等需要深度严谨分析的场景而设计。其在长会话中维持状态的能力,使其非常适合与外部环境进行数小时乃至数天交互的持久化智能体。此外,该模型增强的视觉能力和多模态集成,助力处理复杂的文档布局、技术图表和基于 UI 的自动化任务,确保在多种数据模态下均能提供一致的性能表现。

关于 Claude 4.5

增强型 Claude 模型,在推理、编程和智能体能力(agentic capabilities)方面进行了进一步改进。具备先进的思考模式,提供可调节的投入程度(高、中、标准),以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体,以提高透明度。


其他 Claude 4.5 模型

评估基准

排名

#29

基准分数排名

研究生级问答

GPQA

0.87

7

Web 开发

WebDev Arena

1468

8

0.819

13

专业知识

MMLU Pro

0.86

17

0.55

41

0.66

43

排名

排名

#29

编程排名

#6

模型完整性

总分

F

33 / 100