LLM Model Routing:智能模型选择与混合推理
根据任务复杂度自动选择对应的 LLM 模型。覆盖从简单分类器到 RL 在线学习, 从 query-level 到 token-level,从"选一个"到"全都用"的完整方法谱系。
- 1
Model Routing 全景:为什么一个模型不够
高级#model-routing#llm#cost-optimization#system-design - 2
路由分类器:让小模型决定谁来回答
高级#model-routing#classifier#matrix-factorization#bert#semantic-routing - 3
RouteLLM 实战:从偏好数据到生产路由
高级#model-routing#routellm#matrix-factorization#training#deployment - 4
因子分解机与 LLM 路由:从 FM 理论到 MF 路由器
高级#model-routing#factorization-machines#matrix-factorization#routellm - 5
级联与自验证:先试便宜的,不行再升级
高级#model-routing#cascade#self-verification#pomdp#frugalgpt#automix - 6
Hybrid LLM:本地与云端的智能路由
高级#model-routing#hybrid-llm#local-cloud#privacy#latency - 7
在线学习与成本优化:路由也需要持续进化
高级#model-routing#bandit#reinforcement-learning#pareto#cost-optimization - 8
多模型协作:从选一个到用多个
高级#model-routing#mixture-of-agents#ensemble#council-mode#collaboration