趋近智
注意力结构
Grouped-Query Attention
隐藏维度大小
3072
层数
32
注意力头
24
键值头
8
激活函数
-
归一化
-
位置嵌入
ROPE
Microsoft Phi-4-Mini 是 Phi-4 系列中一款轻量级、开放的模型,旨在资源受限的环境中高效运行。该模型由高质量合成数据和经过过滤的公开网络内容组合构建而成,特别强调高推理密度的数据。其核心架构采用稠密、仅解码器(decoder-only)的 Transformer,并通过分组查询注意力(GQA)和 LongRoPE 位置编码等技术进行了优化,以提升推理速度并管理更长的上下文长度。该模型包含 200,064 个标记(token)的扩展词表,可提供广泛的多语言支持。
Phi-4-Mini 的主要改进包括集成了有监督微调(SFT)和直接偏好优化(DPO)的增强流程,以及来自人类反馈的强化学习(RLHF),以确保强大的指令遵循能力和安全措施。这种训练方法使模型能够展现出强大的推理能力(尤其是在数学和逻辑任务中),并支持函数调用等高级功能。其设计优先考虑计算效率和低延迟性能,使其适用于内存和处理能力受限的部署场景。
Phi-4-Mini 的预期用例涵盖通用人工智能系统,以及在内存或计算受限环境中需要强大推理能力或具有延迟敏感要求的应用。它旨在加速语言模型研究,并作为生成式 AI 功能的基础构建模块。得益于其紧凑的尺寸和优化的架构,该模型可以利用 Microsoft Olive 和 ONNX GenAI Runtime 等工具,在包括各种移动操作系统在内的边缘设备上进行部署。
微软 Phi-4 模型系列由小型语言模型组成,优先关注高效且强大的推理能力。其开发强调严谨的数据质量和先进的合成数据集成。这种方法显著提升了性能,并增强了端侧部署能力。
排名
#107
| 基准 | 分数 | 排名 |
|---|---|---|
通用知识 MMLU | 0.67 | 29 |