Claude Haiku 4.5

闭源

封闭权重

参数

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Oct 2025

训练数据截止日期

Feb 2025

评估基准

排名

#124

基准	分数	排名
StackUnseen ProLLM Stack Unseen	0.476	25
编程 LiveBench Coding	0.72	32
智能编程 LiveBench Agentic	0.33	39
通用文本 Text Arena	1410	49
数据分析 LiveBench Data Analysis	0.45	50
数学 LiveBench Mathematics	0.58	54
推理 LiveBench Reasoning	0.34	59
Web 开发 WebDev Arena	1324	71

排名

#124

编程排名

#95

关于 Claude Haiku 4.5

Claude Haiku 4.5 是一款高吞吐量、多模态大语言模型，专为需要大规模近前沿智能的低延迟应用而设计。在 Claude 4.5 模型家族中，Haiku 作为优化的执行引擎，在计算效率与智能体推理及自主计算机使用等复杂能力之间取得了平衡。它旨在处理复杂的多步指令和海量数据流，使其成为开发人员构建响应式 AI 智能体和实时面向客户服务的首选。

从技术角度来看，该模型采用了稠密 Transformer 架构，并在训练中特别强调上下文感知。这种架构改进使模型能够在其 200,000 token 的上下文窗口内监控自身的 token 消耗，有效缓解了智能体惰性（agentic laziness）问题，并确保在长时运行的任务中保持持续的推理能力。与许多采用旋转嵌入（rotary embeddings）的当代模型不同，Claude 4.5 Haiku 继续沿用绝对位置嵌入结合多头注意力（MHA）机制，以在扩展的上下文中保持结构一致性和精确度。该模型支持多模态输入，能够以极快的速度同时处理和分析视觉数据与文本。

性能特征以快速推理和针对生产级工作负载的成本效益为核心。该版本的一个亮点是引入了“扩展思考”（extended thinking），允许模型在生成输出前分配额外的内部计算资源进行审慎推理。这使得 Haiku 4.5 在子智能体编排中尤为高效，可作为 Sonnet 4.5 等更大模型所制定计划的快速执行器。常见的用例包括自动化金融监控、实时代码重构，以及在技术上要求以较低成本维持高质量的大规模文档处理。

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

键值头

注意力头维度

位置嵌入

Absolute Position Embedding

RoPE Theta

滑动窗口注意力

滑动窗口大小

滑动窗口比例

线性注意力

线性注意力比例

归一化

激活函数

维度

隐藏维度大小

层数

FFN 中间层大小（稠密层）

多 Token 预测头数

分词器

词汇量大小

模型完整性

总分

34 / 100

上游

10.0 / 30

模型

14.0 / 40

下游

10.0 / 30

资源

官方文档发布说明

关于 Claude 4.5

增强型 Claude 模型，在推理、编程和智能体能力（agentic capabilities）方面进行了进一步改进。具备先进的思考模式，提供可调节的投入程度（高、中、标准），以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体，以提高透明度。