Claude Haiku 4.5 Thinking

闭源

封闭权重

参数

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Oct 2025

训练数据截止日期

Feb 2025

评估基准

排名

#65

基准	分数	排名
数据分析 LiveBench Data Analysis	0.59	23
数学 LiveBench Mathematics	0.78	26
智能编程 LiveBench Agentic	0.42	29
编程 LiveBench Coding	0.73	30
推理 LiveBench Reasoning	0.62	35
专业知识 MMLU Pro	0.79	43

排名

#65

编程排名

#64

关于 Claude Haiku 4.5 Thinking

Claude Haiku 4.5 Thinking 是由 Anthropic 开发的高效率大语言模型，旨在提供接近前沿水平的智能，同时保持 Haiku 模型系列特有的低延迟特性。作为一种混合推理模型，它集成了可选的扩展思维模式，允许系统在输出最终响应前进行多步内部推理。这种架构设计平衡了处理复杂问题时的计算需求与实时生产环境所需的响应速度。

在技术层面，该模型在上下文管理和输出能力方面取得了显著进步，支持 200,000 token 的上下文窗口，并能在单次响应中生成多达 64,000 token。它具备明确的上下文感知能力，使系统能够跟踪自身的 token 使用情况，并根据剩余的上下文预算调整推理持续时间。此项能力经过专门调优，旨在缓解智能体的“懒惰”问题，并提升在代码库重构和自主系统编排等长周期任务中的表现。

该模型的实用性集中于高吞吐量、成本敏感型应用，包括客户服务自动化、实时结对编程以及需要并行执行的多智能体系统。通过集成原生视觉能力与文本处理，它支持文档分析和 UI 测试等模态工作流。其在代码编写和工具使用方面的训练重点，使其能够作为开发者工具的响应式引擎，以显著低于旗舰变体的运行成本，提供速度与分析深度的精妙平衡。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

RMS Normalization

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

33 / 100

上游

10.0 / 30

模型

14.0 / 40

下游

9.0 / 30

资源

官方文档发布说明

关于 Claude 4.5

增强型 Claude 模型，在推理、编程和智能体能力（agentic capabilities）方面进行了进一步改进。具备先进的思考模式，提供可调节的投入程度（高、中、标准），以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体，以提高透明度。