趋近智
参数
-
上下文长度
200K
模态
Text
架构
Dense
许可证
Proprietary
发布日期
1 Oct 2025
训练数据截止日期
Feb 2025
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
Claude Haiku 4.5 是一款高吞吐量、多模态大语言模型,专为需要大规模近前沿智能的低延迟应用而设计。在 Claude 4.5 模型家族中,Haiku 作为优化的执行引擎,在计算效率与智能体推理及自主计算机使用等复杂能力之间取得了平衡。它旨在处理复杂的多步指令和海量数据流,使其成为开发人员构建响应式 AI 智能体和实时面向客户服务的首选。
从技术角度来看,该模型采用了稠密 Transformer 架构,并在训练中特别强调上下文感知。这种架构改进使模型能够在其 200,000 token 的上下文窗口内监控自身的 token 消耗,有效缓解了智能体惰性(agentic laziness)问题,并确保在长时运行的任务中保持持续的推理能力。与许多采用旋转嵌入(rotary embeddings)的当代模型不同,Claude 4.5 Haiku 继续沿用绝对位置嵌入结合多头注意力(MHA)机制,以在扩展的上下文中保持结构一致性和精确度。该模型支持多模态输入,能够以极快的速度同时处理和分析视觉数据与文本。
性能特征以快速推理和针对生产级工作负载的成本效益为核心。该版本的一个亮点是引入了“扩展思考”(extended thinking),允许模型在生成输出前分配额外的内部计算资源进行审慎推理。这使得 Haiku 4.5 在子智能体编排中尤为高效,可作为 Sonnet 4.5 等更大模型所制定计划的快速执行器。常见的用例包括自动化金融监控、实时代码重构,以及在技术上要求以较低成本维持高质量的大规模文档处理。
增强型 Claude 模型,在推理、编程和智能体能力(agentic capabilities)方面进行了进一步改进。具备先进的思考模式,提供可调节的投入程度(高、中、标准),以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体,以提高透明度。
排名
#124
| 基准 | 分数 | 排名 |
|---|---|---|
StackUnseen ProLLM Stack Unseen | 0.476 | 25 |
0.72 | 32 | |
0.33 | 39 | |
通用文本 Text Arena | 1410 | 49 |
0.45 | 50 | |
0.58 | 54 | |
0.34 | 59 | |
Web 开发 WebDev Arena | 1324 | 71 |
APX AI
在线