当前位置：首页 AI导航正文

CMMLU-一个综合性的大模型中文评估基准

2026-02-07 AI模型评测

CMMLU是综合性的中文评估基准，专门用在评估语言模型在中文语境下的知识和推理能力，涵盖从基础学科到高级专业水平的67个主题。包括需要计算和推理的自然科学，需要知识的人文科学和社会科学，及需要生活常识的中国驾驶规则等。CMMLU中的许多任务具有中国特定的答案，可能在其他地区或语言中并不普遍适用。CMMLU提供丰富的测试数据和排行榜，支持多种评估方式，如five-shot和zero-shot测试，是衡量中文语言模型性能的重要工具。

资源下载

免费资源

文件1地址点击下载

客服 QQ/微信：858610021

相关

文件1地址点击下载

客服 QQ/微信：858610021

0

评论0