#gpu
7 篇文章
中级
AI Compute Stack 全景 — 从推理框架到硬件指令集
#gpu
#compute
#software-stack
#runtime
#inference
中级
CUDA 编程模型 — 从代码到硬件
#gpu
#cuda
#programming
#simt
#simd
#intel
#sycl
高级
GEMM 优化 — 从 Naive 到极致
#gpu
#gemm
#cuda
#optimization
#tensor-core
#xmx
#intel
中级
GPU Architecture — 从晶体管到线程
#gpu
#architecture
#hardware
#nvidia
中级
矩阵加速单元 — Tensor Core 与 XMX
#gpu
#tensor-core
#xmx
#systolic-array
#nvidia
#intel
高级
代码生成(上):指令选择、Vectorization 与 Register Allocation
#compiler
#codegen
#instruction-selection
#vectorization
#register-allocation
#gpu
高级
Tiling 策略与内存层次优化
#compiler
#tiling
#memory-hierarchy
#gpu
#shared-memory
#optimization