公平采样策略 关键字列表
一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究指责 LM Arena 操纵其热门 AI 基准评测

一项新研究称 LM Arena 平台存在不公正操作,偏向大企业私测的专有模型,而开放模型得不到足够评测,平台运营者对此表示争议。