本站内容由 AI 生成,可能存在错误。如发现问题,欢迎到 GitHub Issues 反馈。

Intel iGPU 推理深度解析:Xe2 架构、oneDNN 与 OpenVINO

从 Xe2 微架构到 oneDNN primitive 体系,从 SPIR-V 编译管线到 OpenVINO 图优化,从性能瓶颈诊断到 GPU+NPU 协同推理,系统理解 Intel iGPU 上的 AI 推理优化全栈。

  1. 1

    Xe2 GPU 架构

    高级
    #intel#xe2#gpu-architecture#igpu#lunar-lake#panther-lake
  2. 2

    Xe2 执行模型与编程抽象

    高级
    #intel#xe2#simd#sycl#execution-model#workgroup
  3. 3

    SPIR-V 编译与 Level Zero 运行时

    高级
    #intel#spirv#level-zero#compiler#runtime#jit#aot
  4. 4

    oneDNN Primitive 体系

    高级
    #intel#onednn#primitive#memory-format#operator-library
  5. 5

    oneDNN GPU Kernel 优化

    高级
    #intel#onednn#kernel-optimization#gemm#xmx#mixed-precision
  6. 6

    OpenVINO 图优化 Pipeline

    高级
    #intel#openvino#graph-optimization#model-compilation#plugin
  7. 7

    Intel 模型优化栈:Optimum Intel / NNCF / OpenVINO 三件套选型

    中级
    #intel#optimum#nncf#openvino#quantization#model-conversion
  8. 8

    性能分析与瓶颈诊断

    高级
    #intel#performance#profiling#roofline#vtune#bottleneck
  9. 9

    NPU 架构与 GPU+NPU 协同推理

    高级
    #intel#npu#openvino#hetero#multi-device#co-inference
  10. 10

    NPU 上的 LLM 推理:KV Cache 与软件栈

    高级
    #intel#npu#llm#kv-cache#openvino#npuw#static-shape
  11. 11

    NPU 执行模型与编程模型的边界

    高级
    #intel#npu#execution-model#dma#tiling#attention#programming-model#cute
  12. 12

    动手:HF → GGUF / ONNX / OpenVINO 三条路径端到端

    中级
    #quantization#model-conversion#hands-on#llama-cpp#onnx#openvino#intel-igpu