MMLU MMLU(Massive Multitask Language Understanding)是用于评估大语言模型多任务语言理解能力的基准任务,涵盖人文、社会科学、自然科学、工程、数学等多个学科领域。Papers with Code 的 MMLU 页面汇总了该任务的最新论文、模型性能排行、评测指标和相关代码资源,便于研究人员了解模型在知识理解、推理和跨领域任务 对话与写作 # AI评测 # MMLU