MMBench 介绍
MMBench 由上海人工智能实验室、OpenCompass 团队与港中文 MMLab 联合发布,是目前最全面的多模态大模型评测平台。它构建 4000+ 道中英双语视觉问答题,覆盖 20+ 核心能力(OCR、视觉定位、常识推理、数学、艺术等),题目经众包+专家双轮审核,确保高区分度;提供一键上传、自动打分、排行榜与可视化报告,支持零样本/少样本两种模式,结果即时更新。平台已集成 GPT-4V、Gemini、Qwen-VL 等主流模型,并开放完整数据与代码,助力开发者快速定位模型短板,推动多模态社区共同进步。