趋近智

所有课程

机器学习编译器优化入门

章节 1: 机器学习编译栈

框架与硬件的差距

ML 编译器的结构

AOT 与 JIT 编译

追踪与图捕获

环境设置实践

章节 2: 中间表示

中间表示（IR）的作用

数据流图与依赖关系

张量形状与数据类型

静态形状与动态形状

章节 3: 图级别优化

算子融合策略

常量折叠与传播

死代码消除

内存布局转换

公共子表达式消除

实现图优化通道

章节 4: 核心与循环优化

循环分块与缓存局部性

循环展开与重排序

内存延迟隐藏

矩阵乘法实践

章节 5: 自动调优与代码生成

定义搜索空间

自动调优中的成本模型

自动化调度搜索

代码生成后端

运行自动调优会话

机器学习编译器优化入门

机器学习 (machine learning)模型，特别是深度神经网络 (neural network)，需要大量计算资源。尽管PyTorch和TensorFlow等框架为模型设计提供了高级抽象，但要在特定硬件上高效运行这些模型，需要在编译器层面进行优化。本课程介绍机器学习编译器的架构和运行机制，重点讲述如何将高级计算图转换为高效的机器码。

您将学习ML模型从图捕获到代码生成的整个生命周期。课程内容包含中间表示（IR）、图级转换以及低级循环优化。您将了解编译器如何进行算子融合、内存布局重写以及硬件专用指令映射。本课程还介绍自动调优策略，这些策略用于在无需手动干预的情况下找到最优执行方案。通过学习这些内容，您将获得使用现代编译器栈检查、调试和提升模型性能所需的技术能力。

先修课程 基础机器学习和编程知识

级别:

中级

编译器架构
理解ML编译器栈的组成部分，包括前端、中间表示和后端代码生成。
图优化
将算子融合、常量折叠和死代码消除等高级转换应用于计算图。
循环调度
实施分块、向量化和循环重排等低级优化，以最大限度地提升硬件利用率。
自动调优
配置并运行自动化搜索过程，以找到特定硬件目标的最优参数。

本课程没有先修课程。

目前没有推荐的后续课程。

登录以撰写评论

分享您的反馈以帮助其他学习者。

© 2026 ApX Machine Learning