Open LLM Leaderboard

由 open-llm-leaderboard 团队创建。它的主要目的是跟踪、排名和评估开源大语言模型（LLMs）和聊天机器人，为用户提供一个透明、可比较的平台，以了解不同模型的性能表现。

大模型评测

访问官网

官网huggingface.co

地区中国

类型网站

浏览次数4

官网点击0

产品介绍

所属公司

Hugging Face (由 open-llm-leaderboard 团队创建并托管于其平台)

产品概述

Open LLM Leaderboard 是一个专注于评估和排名开源大语言模型（LLMs）的在线平台。它的主要目的是跟踪、排名和评估开源大语言模型和聊天机器人，为用户提供一个透明、可比较的基准。其核心价值在于通过标准化的测试集，帮助研究者和开发者客观地了解不同开源模型的性能表现，促进开源生态的健康发展。

发展历史

暂无相关信息。

产品功能

模型性能排名：根据标准化的基准测试分数，对众多开源大语言模型进行综合排名。多维度评估：使用多个公认的评估基准（如ARC, HellaSwag, MMLU等）对模型进行全面测试。结果透明化：公开模型的评估分数和排名依据，确保评估过程的公开和可验证性。社区驱动：作为一个托管在Hugging Face Spaces上的项目，它鼓励社区参与和贡献。

技术优势