HELM

HELM

收藏 checkbox icon

描述:

HELM 介绍

HELM(Holistic Evaluation of Language Models)由斯坦福 CRFM 推出,以“场景-指标-模型”三维框架系统评估基础模型,覆盖 42 个公开数据集、21 类下游任务与 7 大关键指标(准确率、鲁棒性、公平性、效率等),支持零样本、少样本与微调三种范式;提供可复现脚本、云端 GPU 一键复跑与可视化报告,所有数据与代码完全开源,免费使用,被学界与工业界视为权威基准。

HELM 截图

HELM AI评测

上一篇 Midjourney

下一篇 LMArena

HELM 评分

0.0

暂无评分

0条
0条
0条
0条
0条

请给网站评分吧

确认评分

人工智能网站导航

热门点击
AI 导航
  • AI智能体(45)
  • AI聊天问答(54)
  • AI绘画图像(208)
  • AI内容文案(164)
  • AI办公辅助(110)
  • AI编程代码(225)
  • AI设计工具(102)
  • AI视频剪辑(176)
  • AI翻译转换(50)
  • AI其他领域(264)
  • 国产 AI
    添加网站
    浏览记录