#compiler
18 篇文章
高级
SPIR-V 编译与 Level Zero 运行时
#intel
#spirv
#level-zero
#compiler
#runtime
#jit
#aot
高级
计算图捕获:TorchDynamo、AOTAutograd 与 Functionalization
#compiler
#pytorch
#torchdynamo
#aotautograd
#fx-graph
高级
IR 设计(上):SSA、FX IR 与 MLIR Dialect
#compiler
#ir
#ssa
#pytorch
#mlir
#fx-graph
#dialect
高级
IR 设计(下):Progressive Lowering 与多层 IR
#compiler
#mlir
#progressive-lowering
#dialect-conversion
#bufferization
中级
全景图:ML 编译器的世界
#compiler
#pytorch
#mlir
#triton
#optimization
高级
图优化 Pass(中):高级优化与 Pattern Matching
#compiler
#optimization
#layout
#pattern-matching
#memory-planning
高级
图优化 Pass(上):数据流分析基础与通用 Pass 模式
#compiler
#optimization
#pass
#dataflow-analysis
#dce
#cse
高级
图优化 Pass(下):Polyhedral 优化与循环变换
#compiler
#polyhedral
#loop-optimization
#affine
#mlir
#tiling
高级
算子融合(上):融合类型学与判定算法
#compiler
#fusion
#operator-fusion
#kernel-fusion
#optimization
高级
算子融合(下):Cost Model 与融合实战
#compiler
#fusion
#cost-model
#flash-attention
#inductor
#optimization
高级
代码生成(上):指令选择、Vectorization 与 Register Allocation
#compiler
#codegen
#instruction-selection
#vectorization
#register-allocation
#gpu
高级
代码生成(下):Triton Pipeline、编译器后端与数值正确性
#compiler
#codegen
#triton
#llvm
#ptx
#numerical-accuracy
#backends
高级
Dynamic Shapes:从捕获到执行的全链路挑战
#compiler
#dynamic-shapes
#symbolic-shapes
#guards
#bucketing
#pytorch
高级
Tiling 策略与内存层次优化
#compiler
#tiling
#memory-hierarchy
#gpu
#shared-memory
#optimization
高级
自动调优与端到端实战
#compiler
#autotuning
#triton
#mlir
#transform-dialect
#end-to-end
#torch-compile
高级
分布式编译与图分割
#compiler
#distributed
#tensor-parallel
#pipeline-parallel
#gspmd
#sharding
#communication
高级
量化编译与混合精度优化
#compiler
#quantization
#mixed-precision
#kernel-generation
#fusion
高级
调度与执行优化
#compiler
#scheduling
#cuda-stream
#cuda-graph
#memory-planning
#activation-checkpointing
#multi-backend