
FlagEval 天秤
收藏
描述:
FlagEval 天秤 介绍
FlagEval(天秤)是智源研究院推出的开源大模型评测体系,采用“能力-任务-指标”三维框架,覆盖 NLP、CV、语音、多模态四大领域,内置 30+ 能力维度、22 个数据集、超 10 万道题目,支持中英双语,集成 MMLU、C-Eval、CLCC、TACO 等基准,并提供自动化推理与 AI 辅助主观评测,可一键提交模型参与排行,目前完全免费开放。
FlagEval 天秤 截图

FlagEval 天秤 AI评测
上一篇 Midjourney
下一篇 SuperCLUE
FlagEval 天秤 评分
0.0
暂无评分
0条
0条
0条
0条
0条