趋近智
参数
-
上下文长度
200K
模态
Text
架构
Dense
许可证
Proprietary
发布日期
1 Oct 2025
训练数据截止日期
Feb 2025
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
RMS Normalization
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
Claude Haiku 4.5 Thinking 是由 Anthropic 开发的高效率大语言模型,旨在提供接近前沿水平的智能,同时保持 Haiku 模型系列特有的低延迟特性。作为一种混合推理模型,它集成了可选的扩展思维模式,允许系统在输出最终响应前进行多步内部推理。这种架构设计平衡了处理复杂问题时的计算需求与实时生产环境所需的响应速度。
在技术层面,该模型在上下文管理和输出能力方面取得了显著进步,支持 200,000 token 的上下文窗口,并能在单次响应中生成多达 64,000 token。它具备明确的上下文感知能力,使系统能够跟踪自身的 token 使用情况,并根据剩余的上下文预算调整推理持续时间。此项能力经过专门调优,旨在缓解智能体的“懒惰”问题,并提升在代码库重构和自主系统编排等长周期任务中的表现。
该模型的实用性集中于高吞吐量、成本敏感型应用,包括客户服务自动化、实时结对编程以及需要并行执行的多智能体系统。通过集成原生视觉能力与文本处理,它支持文档分析和 UI 测试等模态工作流。其在代码编写和工具使用方面的训练重点,使其能够作为开发者工具的响应式引擎,以显著低于旗舰变体的运行成本,提供速度与分析深度的精妙平衡。
增强型 Claude 模型,在推理、编程和智能体能力(agentic capabilities)方面进行了进一步改进。具备先进的思考模式,提供可调节的投入程度(高、中、标准),以实现性能与延迟之间的最优权衡。在复杂分析、软件开发、Web 开发和长上下文理解方面表现卓越。包含可展示推理过程的思考变体,以提高透明度。
排名
#56
| 基准 | 分数 | 排名 |
|---|---|---|
0.59 | 23 | |
0.78 | 26 | |
0.73 | 29 | |
0.42 | 29 | |
0.62 | 35 | |
专业知识 MMLU Pro | 0.79 | 43 |
APX AI
在线