#openvino
7 篇文章
高级
NPU 架构与 GPU+NPU 协同推理
#intel
#npu
#openvino
#hetero
#multi-device
#co-inference
高级
OpenVINO 图优化 Pipeline
#intel
#openvino
#graph-optimization
#model-compilation
#plugin
中级
优化对精度的影响
#benchmark
#quantization
#accuracy
#perplexity
#openvino
#lm-eval-harness
#llama-cpp
高级
NPU 上的 LLM 推理:KV Cache 与软件栈
#intel
#npu
#llm
#kv-cache
#openvino
#npuw
#static-shape
中级
Intel 模型优化栈:Optimum Intel / NNCF / OpenVINO 三件套选型
#intel
#optimum
#nncf
#openvino
#quantization
#model-conversion
中级
量化与模型转换工具链全景
#quantization
#model-conversion
#toolchain
#optimum
#nncf
#openvino
#gguf
#onnx
中级
动手:HF → GGUF / ONNX / OpenVINO 三条路径端到端
#quantization
#model-conversion
#hands-on
#llama-cpp
#onnx
#openvino
#intel-igpu