Tuning Technique

根据算法和硬件进行自动搜索,选择最优的参数配置,以最大化程序效率

AI Compiler

Memory Optimization in AI Compiler

内存管理优化的思路主要是: 调整分配、释放的时间点和次数,减少分配、释放内存给运行时带来的时间开销 优化分配过程,尽可能减少总的内存占用。例如,通过跟踪计算图,只分配 peak 所需的内存 常规的做法的话,一般跑两次: 第一次是 AI Comp...

AI Compiler

Operator-Level Optimization in AI Compilers

Some optimization techniques for operators in AI compilers.

AI Compiler

An Overview on Frontend Optimization of AI Compiler

图层优化 将一种计算图结构,在不改变算数结果的情况下,基于设定好的规则,对计算图进行相应的图替换操作. 读写冗余:一些计算场景中存在重复读写内存、或者内存访问不连续,降低 cache hit rate,导致多余的内存传输 结构冗余:模型存在无效的...

AI Compiler

An Overview on AI Compiler

从 Top Level 视角看 AI 编译器技术

AI Compiler