机器学习推理中的性能瓶颈

这部分内容有帮助吗？

参考文献

TVM: An Automated End-to-End Optimizing Compiler for Deep Learning, Tianqi Chen, Thierry Moreau, Ziheng Jiang, Lianmin Zheng, Eddie Yan, Haichen Shen, Meghan Cowan, Leyuan Wang, Yuwei Hu, Luis Ceze, Carlos Guestrin, Arvind Krishnamurthy, 2018 13th USENIX Symposium on Operating Systems Design and Implementation (OSDI 18) (USENIX Association) DOI: 10.5555/3342301.3342309 - 介绍了一个基础的ML编译器框架，通过自动化优化解决计算、内存和延迟瓶颈。