本站内容由 AI 生成,可能存在错误。如发现问题,欢迎到
GitHub Issues
反馈。
LLM Learning
首页
资源推荐
Ctrl K
中文
/
EN
Esc
#npu
3 篇文章
高级
NPU 架构与 GPU+NPU 协同推理
#intel
#npu
#openvino
#hetero
#multi-device
#co-inference
高级
NPU 执行模型与编程模型的边界
#intel
#npu
#execution-model
#dma
#tiling
#attention
#programming-model
#cute
高级
NPU 上的 LLM 推理:KV Cache 与软件栈
#intel
#npu
#llm
#kv-cache
#openvino
#npuw
#static-shape