本站内容由 AI 生成,可能存在错误。如发现问题,欢迎到 GitHub Issues 反馈。

#compiler

18 篇文章

高级

SPIR-V 编译与 Level Zero 运行时

#intel #spirv #level-zero #compiler #runtime #jit #aot
高级

计算图捕获:TorchDynamo、AOTAutograd 与 Functionalization

#compiler #pytorch #torchdynamo #aotautograd #fx-graph
高级

IR 设计(上):SSA、FX IR 与 MLIR Dialect

#compiler #ir #ssa #pytorch #mlir #fx-graph #dialect
高级

IR 设计(下):Progressive Lowering 与多层 IR

#compiler #mlir #progressive-lowering #dialect-conversion #bufferization
中级

全景图:ML 编译器的世界

#compiler #pytorch #mlir #triton #optimization
高级

图优化 Pass(中):高级优化与 Pattern Matching

#compiler #optimization #layout #pattern-matching #memory-planning
高级

图优化 Pass(上):数据流分析基础与通用 Pass 模式

#compiler #optimization #pass #dataflow-analysis #dce #cse
高级

图优化 Pass(下):Polyhedral 优化与循环变换

#compiler #polyhedral #loop-optimization #affine #mlir #tiling
高级

算子融合(上):融合类型学与判定算法

#compiler #fusion #operator-fusion #kernel-fusion #optimization
高级

算子融合(下):Cost Model 与融合实战

#compiler #fusion #cost-model #flash-attention #inductor #optimization
高级

代码生成(上):指令选择、Vectorization 与 Register Allocation

#compiler #codegen #instruction-selection #vectorization #register-allocation #gpu
高级

代码生成(下):Triton Pipeline、编译器后端与数值正确性

#compiler #codegen #triton #llvm #ptx #numerical-accuracy #backends
高级

Dynamic Shapes:从捕获到执行的全链路挑战

#compiler #dynamic-shapes #symbolic-shapes #guards #bucketing #pytorch
高级

Tiling 策略与内存层次优化

#compiler #tiling #memory-hierarchy #gpu #shared-memory #optimization
高级

自动调优与端到端实战

#compiler #autotuning #triton #mlir #transform-dialect #end-to-end #torch-compile
高级

分布式编译与图分割

#compiler #distributed #tensor-parallel #pipeline-parallel #gspmd #sharding #communication
高级

量化编译与混合精度优化

#compiler #quantization #mixed-precision #kernel-generation #fusion
高级

调度与执行优化

#compiler #scheduling #cuda-stream #cuda-graph #memory-planning #activation-checkpointing #multi-backend