ApX 标志ApX 标志

趋近智

Phi-4-Mini

参数

3.8B

上下文长度

128K

模态

Text

架构

Dense

许可证

MIT

发布日期

27 Feb 2025

训练数据截止日期

Jun 2024

技术规格

注意力结构

Grouped-Query Attention

隐藏维度大小

3072

层数

32

注意力头

24

键值头

8

激活函数

-

归一化

-

位置嵌入

ROPE

Phi-4-Mini

Microsoft Phi-4-Mini 是 Phi-4 系列中一款轻量级、开放的模型,旨在资源受限的环境中高效运行。该模型由高质量合成数据和经过过滤的公开网络内容组合构建而成,特别强调高推理密度的数据。其核心架构采用稠密、仅解码器(decoder-only)的 Transformer,并通过分组查询注意力(GQA)和 LongRoPE 位置编码等技术进行了优化,以提升推理速度并管理更长的上下文长度。该模型包含 200,064 个标记(token)的扩展词表,可提供广泛的多语言支持。

Phi-4-Mini 的主要改进包括集成了有监督微调(SFT)和直接偏好优化(DPO)的增强流程,以及来自人类反馈的强化学习(RLHF),以确保强大的指令遵循能力和安全措施。这种训练方法使模型能够展现出强大的推理能力(尤其是在数学和逻辑任务中),并支持函数调用等高级功能。其设计优先考虑计算效率和低延迟性能,使其适用于内存和处理能力受限的部署场景。

Phi-4-Mini 的预期用例涵盖通用人工智能系统,以及在内存或计算受限环境中需要强大推理能力或具有延迟敏感要求的应用。它旨在加速语言模型研究,并作为生成式 AI 功能的基础构建模块。得益于其紧凑的尺寸和优化的架构,该模型可以利用 Microsoft Olive 和 ONNX GenAI Runtime 等工具,在包括各种移动操作系统在内的边缘设备上进行部署。

关于 Phi-4

微软 Phi-4 模型系列由小型语言模型组成,优先关注高效且强大的推理能力。其开发强调严谨的数据质量和先进的合成数据集成。这种方法显著提升了性能,并增强了端侧部署能力。


其他 Phi-4 模型

评估基准

排名

#107

基准分数排名

通用知识

MMLU

0.67

29

排名

排名

#107

编程排名

-

模型透明度

总分

B+

75 / 100

GPU 要求

完整计算器

选择模型权重的量化方法

上下文大小:1024 个令牌

1k
63k
125k

所需显存:

推荐 GPU