ApX 标志ApX 标志

趋近智

Claude Haiku 4.5 Thinking

参数

-

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Oct 2025

训练数据截止日期

Feb 2025

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

RMS Normalization

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

Claude Haiku 4.5 Thinking

Claude Haiku 4.5 Thinking 是由 Anthropic 开发的高效率大语言模型,旨在提供接近前沿水平的智能,同时保持 Haiku 模型系列特有的低延迟特性。作为一种混合推理模型,它集成了可选的扩展思维模式,允许系统在输出最终响应前进行多步内部推理。这种架构设计平衡了处理复杂问题时的计算需求与实时生产环境所需的响应速度。

在技术层面,该模型在上下文管理和输出能力方面取得了显著进步,支持 200,000 token 的上下文窗口,并能在单次响应中生成多达 64,000 token。它具备明确的上下文感知能力,使系统能够跟踪自身的 token 使用情况,并根据剩余的上下文预算调整推理持续时间。此项能力经过专门调优,旨在缓解智能体的“懒惰”问题,并提升在代码库重构和自主系统编排等长周期任务中的表现。

该模型的实用性集中于高吞吐量、成本敏感型应用,包括客户服务自动化、实时结对编程以及需要并行执行的多智能体系统。通过集成原生视觉能力与文本处理,它支持文档分析和 UI 测试等模态工作流。其在代码编写和工具使用方面的训练重点,使其能够作为开发者工具的响应式引擎,以显著低于旗舰变体的运行成本,提供速度与分析深度的精妙平衡。

关于 Claude 4.5

增强型 Claude 模型,在推理、编程和智能体能力(agentic capabilities)方面进行了进一步改进。具备先进的思考模式,提供可调节的投入程度(高、中、标准),以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体,以提高透明度。


其他 Claude 4.5 模型

评估基准

排名

#56

基准分数排名

0.59

23

0.78

26

0.73

29

智能编程

LiveBench Agentic

0.42

29

0.62

35

专业知识

MMLU Pro

0.79

43

排名

排名

#56

编程排名

#54

模型完整性

总分

F

33 / 100