#optimization
10 篇文章
高级
GEMM 优化 — 从 Naive 到极致
#gpu
#gemm
#cuda
#optimization
#tensor-core
#xmx
#intel
高级
KV Cache 原理
#inference
#kv-cache
#memory
#optimization
高级
Speculative Decoding — 猜测式解码加速
#inference
#optimization
#speculative-decoding
中级
全景图:ML 编译器的世界
#compiler
#pytorch
#mlir
#triton
#optimization
高级
图优化 Pass(中):高级优化与 Pattern Matching
#compiler
#optimization
#layout
#pattern-matching
#memory-planning
高级
图优化 Pass(上):数据流分析基础与通用 Pass 模式
#compiler
#optimization
#pass
#dataflow-analysis
#dce
#cse
高级
算子融合(上):融合类型学与判定算法
#compiler
#fusion
#operator-fusion
#kernel-fusion
#optimization
高级
算子融合(下):Cost Model 与融合实战
#compiler
#fusion
#cost-model
#flash-attention
#inductor
#optimization
高级
Tiling 策略与内存层次优化
#compiler
#tiling
#memory-hierarchy
#gpu
#shared-memory
#optimization
高级
优化算法:从梯度下降到牛顿法
#matrix-math
#optimization
#gradient-descent
#newton-method
#sgd
#convergence