ApX 标志ApX 标志

趋近智

Claude Haiku 4.5

参数

-

上下文长度

200K

模态

Text

架构

Dense

许可证

Proprietary

发布日期

1 Oct 2025

训练数据截止日期

Feb 2025

技术规格

注意力

注意力结构

Multi-Head Attention

注意力头

-

键值头

-

注意力头维度

-

位置嵌入

Absolute Position Embedding

RoPE Theta

-

滑动窗口注意力

-

滑动窗口大小

-

归一化

-

激活函数

-

维度

隐藏维度大小

-

层数

-

FFN 中间层大小(稠密层)

-

多 Token 预测头数

-

分词器

词汇量大小

-

Claude Haiku 4.5

Claude Haiku 4.5 是一款高吞吐量、多模态大语言模型,专为需要大规模近前沿智能的低延迟应用而设计。在 Claude 4.5 模型家族中,Haiku 作为优化的执行引擎,在计算效率与智能体推理及自主计算机使用等复杂能力之间取得了平衡。它旨在处理复杂的多步指令和海量数据流,使其成为开发人员构建响应式 AI 智能体和实时面向客户服务的首选。

从技术角度来看,该模型采用了稠密 Transformer 架构,并在训练中特别强调上下文感知。这种架构改进使模型能够在其 200,000 token 的上下文窗口内监控自身的 token 消耗,有效缓解了智能体惰性(agentic laziness)问题,并确保在长时运行的任务中保持持续的推理能力。与许多采用旋转嵌入(rotary embeddings)的当代模型不同,Claude 4.5 Haiku 继续沿用绝对位置嵌入结合多头注意力(MHA)机制,以在扩展的上下文中保持结构一致性和精确度。该模型支持多模态输入,能够以极快的速度同时处理和分析视觉数据与文本。

性能特征以快速推理和针对生产级工作负载的成本效益为核心。该版本的一个亮点是引入了“扩展思考”(extended thinking),允许模型在生成输出前分配额外的内部计算资源进行审慎推理。这使得 Haiku 4.5 在子智能体编排中尤为高效,可作为 Sonnet 4.5 等更大模型所制定计划的快速执行器。常见的用例包括自动化金融监控、实时代码重构,以及在技术上要求以较低成本维持高质量的大规模文档处理。

关于 Claude 4.5

增强型 Claude 模型,在推理、编程和智能体能力(agentic capabilities)方面进行了进一步改进。具备先进的思考模式,提供可调节的投入程度(高、中、标准),以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体,以提高透明度。


其他 Claude 4.5 模型

评估基准

排名

#124

基准分数排名

0.476

25

0.72

32

智能编程

LiveBench Agentic

0.33

39

通用文本

Text Arena

1410

49

0.45

50

0.58

54

0.34

59

Web 开发

WebDev Arena

1324

71

排名

排名

#124

编程排名

#95

模型完整性

总分

F

34 / 100

Claude Haiku 4.5:模型规格和详细信息