本站内容由 AI 生成，可能存在错误。如发现问题，欢迎到 GitHub Issues 反馈。

Intel iGPU 推理深度解析：Xe2 架构、oneDNN 与 OpenVINO

从 Xe2 微架构到 oneDNN primitive 体系，从 SPIR-V 编译管线到 OpenVINO 图优化，从性能瓶颈诊断到 GPU+NPU 协同推理，系统理解 Intel iGPU 上的 AI 推理优化全栈。

1

Xe2 GPU 架构
高级

#intel#xe2#gpu-architecture#igpu#lunar-lake#panther-lake
2

Xe2 执行模型与编程抽象
高级

#intel#xe2#simd#sycl#execution-model#workgroup
3

SPIR-V 编译与 Level Zero 运行时
高级

#intel#spirv#level-zero#compiler#runtime#jit#aot
4

oneDNN Primitive 体系
高级

#intel#onednn#primitive#memory-format#operator-library
5

oneDNN GPU Kernel 优化
高级

#intel#onednn#kernel-optimization#gemm#xmx#mixed-precision
6

OpenVINO 图优化 Pipeline
高级

#intel#openvino#graph-optimization#model-compilation#plugin
7

Intel 模型优化栈：Optimum Intel / NNCF / OpenVINO 三件套选型
中级

#intel#optimum#nncf#openvino#quantization#model-conversion
8

性能分析与瓶颈诊断
高级

#intel#performance#profiling#roofline#vtune#bottleneck
9

NPU 架构与 GPU+NPU 协同推理
高级

#intel#npu#openvino#hetero#multi-device#co-inference
10

NPU 上的 LLM 推理：KV Cache 与软件栈
高级

#intel#npu#llm#kv-cache#openvino#npuw#static-shape
11

NPU 执行模型与编程模型的边界
高级

#intel#npu#execution-model#dma#tiling#attention#programming-model#cute
12

动手：HF → GGUF / ONNX / OpenVINO 三条路径端到端
中级

#quantization#model-conversion#hands-on#llama-cpp#onnx#openvino#intel-igpu