MMBench

描述：全面的多模态大模型评测平台

MMBench 介绍

MMBench 由上海人工智能实验室、OpenCompass 团队与港中文 MMLab 联合发布，是目前最全面的多模态大模型评测平台。它构建 4000+ 道中英双语视觉问答题，覆盖 20+ 核心能力（OCR、视觉定位、常识推理、数学、艺术等），题目经众包+专家双轮审核，确保高区分度；提供一键上传、自动打分、排行榜与可视化报告，支持零样本/少样本两种模式，结果即时更新。平台已集成 GPT-4V、Gemini、Qwen-VL 等主流模型，并开放完整数据与代码，助力开发者快速定位模型短板，推动多模态社区共同进步。

MMBench 截图

MMBench AI评测

上一篇 GhatGPT

下一篇 HELM

MMBench 评分

0.0

暂无评分

5星

0条

4星

0条

3星

0条

2星

0条

1星

0条

请给网站评分吧

确认评分

MMBench

MMBench 介绍

MMBench 截图

MMBench AI评测

MMBench 评分

标签

你可能感兴趣的

人工智能网站导航

MMBench

MMBench 介绍

MMBench 截图

MMBench AI评测

MMBench 评分

标签

你可能感兴趣的

人工智能网站导航

复制成功

反馈

QQ分享

微博分享

注册/登录