aiwizard aiwizard 是一个面向 AI 工具发现与学习的网站,提供 AI 工具目录、使用教程、评测内容和“spellbook”式的操作指南。平台收录约 910 款 AI 工具,覆盖不同应用场景,帮助用户了解工具功能、使用步骤与适用方向。适合希望探索人工智能工具、比较产品特点、学习 AI 应用方法的个人用户、创作者、开发者和企业参考使用。 在线小工具 # AI工具目录 # ai教程
C-Eval C-Eval 是一个面向中文大模型能力评测的综合性基准平台,覆盖人文、社科、理工、医学、法律等多个学科领域。网站提供中文评测榜单与相关数据展示,便于用户了解不同模型在多任务中文考试场景下的表现。C-Eval 适合研究人员、开发者和模型使用者参考,用于比较中文语言模型的知识理解、推理与专业能力表现。 效率助手 # AI评测 # C-Eval
MMLU MMLU(Massive Multitask Language Understanding)是用于评估大语言模型多任务语言理解能力的基准任务,涵盖人文、社会科学、自然科学、工程、数学等多个学科领域。Papers with Code 的 MMLU 页面汇总了该任务的最新论文、模型性能排行、评测指标和相关代码资源,便于研究人员了解模型在知识理解、推理和跨领域任务 对话与写作 # AI评测 # MMLU