本站内容由 AI 生成,可能存在错误。如发现问题,欢迎到 GitHub Issues 反馈。

AI Compute Stack

从推理框架到硬件指令集,理解 AI 软件栈的各层关系

  1. 1

    AI Compute Stack 全景 — 从推理框架到硬件指令集

    中级
    #gpu#compute#software-stack#runtime#inference
  2. 2

    GPU Architecture — 从晶体管到线程

    中级
    #gpu#architecture#hardware#nvidia
  3. 3

    矩阵加速单元 — Tensor Core 与 XMX

    中级
    #gpu#tensor-core#xmx#systolic-array#nvidia#intel
  4. 4

    CUDA 编程模型 — 从代码到硬件

    中级
    #gpu#cuda#programming#simt#simd#intel#sycl
  5. 5

    GEMM 优化 — 从 Naive 到极致

    高级
    #gpu#gemm#cuda#optimization#tensor-core#xmx#intel