
LLMEval3
收藏
描述:
LLMEval3 介绍
LLMEval3 是复旦大学 NLP 实验室 2024 年发布的第三代中文大模型专业知识评测基准,覆盖教育部全部 13 个学科门类、50+ 二级学科,含约 20 万道生成式问答;采用在线随机抽题(每轮 1000 题)与 GPT-4 Turbo 自动评分(0-3 分制),防止题库泄露与刷榜,支持一键提交、实时榜单与详细报告,全面衡量模型在专业场景的知识掌握与推理能力。
LLMEval3 截图

LLMEval3 AI评测
上一篇 Midjourney
下一篇 H2O EvalGPT
LLMEval3 评分
0.0
暂无评分
0条
0条
0条
0条
0条