趋近智
注意力
注意力结构
Multi-Head Attention
注意力头
-
键值头
-
注意力头维度
-
位置嵌入
Absolute Position Embedding
RoPE Theta
-
滑动窗口注意力
-
滑动窗口大小
-
归一化
-
激活函数
-
维度
隐藏维度大小
-
层数
-
FFN 中间层大小(稠密层)
-
多 Token 预测头数
-
分词器
词汇量大小
-
阿里巴巴于 2026 年 5 月 20 日发布的面向智能体时代的自研前沿模型。Qwen3.7-Max 专为通用智能体基座而打造,能够编写与调试代码、自动化办公工作流,并支持长达数百至数千步的持续自主执行。在先前未公开的硬件上,经过 35 小时的连续自主执行,该模型在 Extend Attention 算子上实现了 10 倍的几何平均加速。其具备 100 万 (1M) token 的上下文窗口,并支持在 Claude Code、OpenClaw、Qwen Code 等框架下的跨框架(cross-scaffold)泛化。
Alibaba's Qwen 3.7 generation is designed for the agent era, delivering frontier-level agentic reasoning and long-horizon autonomous execution. Qwen3.7 models combine deep coding agent capabilities with broad cross-scaffold generalization, sustaining productive execution over multi-hour sessions with thousands of tool calls. The family includes both text-focused and full multimodal variants.
排名
#4
| 基准 | 分数 | 排名 |
|---|---|---|
Web 开发 WebDev Arena | 1534 | ⭐ 6 |
通用文本 Text Arena | 1474 | ⭐ 8 |
排名
#4
编程排名
#15
APX AI
在线