AI 编译器全景

AI Overview

传统编译器里通常将编译分为三个部分：前端 (frontend)、优化器 (optimizer)、后端 (backend)．编译过程以高级语言作为输入……

来到 AI 时代，我们希望模型（本质是矩阵乘法和元素操作）可以高效运行，同时需要支持多个深度学习框架（如 PyTorch, TensorFlow 之流）和多个计算硬件（如 AMD 显卡、NVIDIA 显卡、TPU 等等）．这样的需要和编译器的职责是类似的．但是如果直接照搬传统编译器会有几个问题：

What is AI Compiler?

AI 编译器是一种针对 AI 和机器学习应用特别优化的编译器，可以满足推理场景和训练场景的不同需求，将高级语言编写好的模型或者训练好的模型文件转换成可以在特定硬件上高效执行的程序．

前端经过多种优化（如代数简化、算子融合、操作下沉、公共子表达式消除、静态内存规划等等），得到初步优化的计算图，随后通过模式匹配和图重写等方法进一步优化，最终生成优化后的计算图
后端将优化后的 IR 转换为特定平台的高效代码．后端模块通常包括
- 硬件特定的优化器，如针对 GPU 的并行化策略、针对 TPU 的矩阵乘法优化、针对 FGPA 的流水线调度．
- 自动调优技术，如自动搜索最优参数配置

Case Study: TVM

简单介绍一下 TVM 的工作流程：

Case Study: MLIR