本站内容由 AI 生成,可能存在错误。如发现问题,欢迎到
GitHub Issues
反馈。
LLM Learning
首页
资源推荐
Ctrl K
中文
/
EN
Esc
#evaluation
3 篇文章
中级
Benchmark 全景与评估方法论
#benchmark
#evaluation
#methodology
#llm-as-judge
#contamination
高级
BFCL 实操指南
#benchmark
#bfcl
#function-calling
#tool-use
#evaluation
高级
lm-eval-harness 实操指南
#benchmark
#lm-eval
#evaluation
#harness
#task-yaml