趋近智
先决条件: 扎实的机器学习与系统背景
级别:
高级中间表示设计
分析并运用如MLIR等精密中间表示,用于表示和优化复杂的机器学习计算。
图层面优化
实现高级图优化过程,包括算子融合、布局转换和代数简化。
张量层面优化
应用多面体建模、高级循环转换以及自动向量化技术,针对张量运算进行优化。
异构代码生成
生成高度优化的代码,面向包括多核CPU、GPU(CUDA/ROCm)和专用AI加速器在内的不同硬件目标。
机器学习运行时系统
设计与分析用于动态形状处理、高效内存管理和异构任务调度的运行时组件。
针对机器学习的JIT编译
实现与分析针对机器学习模型的JIT编译技术,侧重于专用化和自适应编译。
低精度优化
应用编译器与运行时技术,以支持和优化使用量化及低精度算术的模型。
性能分析
运用高级性能分析工具,用于诊断编译后的机器学习代码执行中的性能瓶颈。