本站内容由 AI 生成,可能存在错误。如发现问题,欢迎到 GitHub Issues 反馈。

LLM Model Routing:智能模型选择与混合推理

根据任务复杂度自动选择对应的 LLM 模型。覆盖从简单分类器到 RL 在线学习, 从 query-level 到 token-level,从"选一个"到"全都用"的完整方法谱系。

  1. 1

    Model Routing 全景:为什么一个模型不够

    高级
    #model-routing#llm#cost-optimization#system-design
  2. 2

    路由分类器:让小模型决定谁来回答

    高级
    #model-routing#classifier#matrix-factorization#bert#semantic-routing
  3. 3

    RouteLLM 实战:从偏好数据到生产路由

    高级
    #model-routing#routellm#matrix-factorization#training#deployment
  4. 4

    因子分解机与 LLM 路由:从 FM 理论到 MF 路由器

    高级
    #model-routing#factorization-machines#matrix-factorization#routellm
  5. 5

    级联与自验证:先试便宜的,不行再升级

    高级
    #model-routing#cascade#self-verification#pomdp#frugalgpt#automix
  6. 6

    Hybrid LLM:本地与云端的智能路由

    高级
    #model-routing#hybrid-llm#local-cloud#privacy#latency
  7. 7

    在线学习与成本优化:路由也需要持续进化

    高级
    #model-routing#bandit#reinforcement-learning#pareto#cost-optimization
  8. 8

    多模型协作:从选一个到用多个

    高级
    #model-routing#mixture-of-agents#ensemble#council-mode#collaboration