AI Compute Stack
从推理框架到硬件指令集,理解 AI 软件栈的各层关系
- 1
AI Compute Stack 全景 — 从推理框架到硬件指令集
中级#gpu#compute#software-stack#runtime#inference - 2
GPU Architecture — 从晶体管到线程
中级#gpu#architecture#hardware#nvidia - 3
矩阵加速单元 — Tensor Core 与 XMX
中级#gpu#tensor-core#xmx#systolic-array#nvidia#intel - 4
CUDA 编程模型 — 从代码到硬件
中级#gpu#cuda#programming#simt#simd#intel#sycl - 5
GEMM 优化 — 从 Naive 到极致
高级#gpu#gemm#cuda#optimization#tensor-core#xmx#intel