趋近智
在处理完图级别优化之后,我们现在将重心放在机器学习模型中计算密集的核心部分:张量运算。诸如矩阵乘法(常表示为 C=A×B)或卷积之类的运算,在实现中常表现为复杂且嵌套的循环结构。有效运行这些循环对于性能最大化不可或缺。
本章将介绍优化这些特定张量计算的方法。你将学到:
4.1 将张量计算表示为循环嵌套
4.2 多面体建模简介
4.3 迭代域、访问函数和依赖
4.4 调度变换 (倾斜变换, 分块)
4.5 多面体调度下的代码生成
4.6 自动向量化技术 (SIMD)
4.7 内存层级优化:分块和预取
4.8 动手实践:使用多面体工具优化循环
© 2026 ApX Machine Learning用心打造