Intel iGPU 推理深度解析:Xe2 架构、oneDNN 与 OpenVINO
从 Xe2 微架构到 oneDNN primitive 体系,从 SPIR-V 编译管线到 OpenVINO 图优化,从性能瓶颈诊断到 GPU+NPU 协同推理,系统理解 Intel iGPU 上的 AI 推理优化全栈。
- 1
Xe2 GPU 架构
高级#intel#xe2#gpu-architecture#igpu#lunar-lake#panther-lake - 2
Xe2 执行模型与编程抽象
高级#intel#xe2#simd#sycl#execution-model#workgroup - 3
SPIR-V 编译与 Level Zero 运行时
高级#intel#spirv#level-zero#compiler#runtime#jit#aot - 4
oneDNN Primitive 体系
高级#intel#onednn#primitive#memory-format#operator-library - 5
oneDNN GPU Kernel 优化
高级#intel#onednn#kernel-optimization#gemm#xmx#mixed-precision - 6
OpenVINO 图优化 Pipeline
高级#intel#openvino#graph-optimization#model-compilation#plugin - 7
Intel 模型优化栈:Optimum Intel / NNCF / OpenVINO 三件套选型
中级#intel#optimum#nncf#openvino#quantization#model-conversion - 8
性能分析与瓶颈诊断
高级#intel#performance#profiling#roofline#vtune#bottleneck - 9
NPU 架构与 GPU+NPU 协同推理
高级#intel#npu#openvino#hetero#multi-device#co-inference - 10
NPU 上的 LLM 推理:KV Cache 与软件栈
高级#intel#npu#llm#kv-cache#openvino#npuw#static-shape - 11
NPU 执行模型与编程模型的边界
高级#intel#npu#execution-model#dma#tiling#attention#programming-model#cute - 12
动手:HF → GGUF / ONNX / OpenVINO 三条路径端到端
中级#quantization#model-conversion#hands-on#llama-cpp#onnx#openvino#intel-igpu