
C-Eval
收藏
描述:
C-Eval 介绍
C-Eval 是上海交通大学、清华大学与爱丁堡大学联合发布的中文大模型综合评估套件,含 13 948 道四选一题,覆盖 52 个学科、中学至专业四级难度,并设高难度 C-Eval Hard 子集;支持零样本与 5-shot 评估,已集成 lm-evaluation-harness,官方排行榜自动计算测试集准确率,完全开源免费,被全球顶尖实验室广泛采用。
C-Eval 截图

C-Eval AI评测
上一篇 Midjourney
下一篇 FlagEval 天秤
C-Eval 评分
0.0
暂无评分
0条
0条
0条
0条
0条