MMLU MMLU(Massive Multitask Language Understanding)是用于评估大语言模型多任务语言理解能力的基准任务,涵盖人文、社会科学、自然科学、工程、数学等多个学科领域。Papers with Code 的 MMLU 页面汇总了该任务的最新论文、模型性能排行、评测指标和相关代码资源,便于研究人员了解模型在知识理解、推理和跨领域任务 对话与写作 # AI评测 # MMLU
Scale AI Scale AI 是一家面向 AI 实验室、政府机构和大型企业的数据与评估服务平台,提供用于人工智能模型训练、测试与部署的数据标注、数据管理、模型评估和结果交付等能力。其服务覆盖自动驾驶、生成式 AI、企业智能化与公共部门等场景,帮助客户获取高质量数据、评估模型表现并优化 AI 应用效果。 效率助手 # AI数据平台 # 企业AI
StableVicuna StableVicuna 是可通过 LMSYS Chatbot Arena 平台访问的开源对话式 AI 模型之一,面向自然语言问答、内容生成、对话交流等场景。用户可在网页中体验不同大语言模型的聊天能力,并进行模型对比与交互测试。该站点适合关注开源大模型、AI 聊天机器人、语言模型评测与在线体验的用户参考使用。 对话与写作 # AI聊天 # Chatbot Arena
Lamini Lamini 是一个专注于企业级大模型开发与部署的 AI 平台,提供大语言模型微调、定制、评估和推理等能力,帮助团队基于自身数据构建专属 AI 应用。平台面向需要安全、可控和可扩展 AI 解决方案的企业与开发者,适用于知识问答、自动化流程、数据分析和行业模型构建等场景。 后端架构 # AI部署 # 企业级AI
阿里巴巴M6 阿里巴巴M6是阿里云推出的生成式大模型应用入口,面向开发者、企业和个人用户提供智能对话、内容生成、代码辅助、知识问答等能力。平台依托阿里云大模型与云计算基础设施,支持多场景 AI 应用体验与能力接入,适合用于了解阿里系人工智能产品、探索大模型服务及相关解决方案。 对话与写作 # 代码辅助 # 内容生成
序列猴子 序列猴子开放平台是出门问问推出的超大规模语言模型服务平台,面向开发者和企业提供长序列、多模态、单模型与大数据能力支持。平台依托通用表示能力和推理能力,可用于多轮对话、内容生成、信息理解、智能交互等应用场景,帮助用户构建更便捷、流畅的 AI 应用体验。 后端架构 # AI开放平台 # API服务
DeepFloyd IF DeepFloyd IF 是由 DeepFloyd 团队推出的文本生成图像模型项目,基于级联扩散模型架构,支持根据自然语言提示生成高质量图像,并在文字渲染、细节表现和复杂语义理解方面具有较强能力。该页面提供 DeepFloyd IF 的模型介绍、功能特点、技术信息及相关资源,适合关注 AI 绘画、文本到图像生成、扩散模型和生成式人工智能应用的用户了解与参考。 绘画与设计 # AI绘画 # DeepFloyd
MiracleVision奇想智能 MiracleVision奇想智能(美图AI开放平台)是美图公司推出的人工智能服务平台,面向开发者与企业提供图像、视频及生成式AI能力。平台涵盖人脸人体、图像识别与处理、美颜、抠图、画质修复、影楼修图、商品图处理、AI模特、海报生成等技术服务与行业解决方案,适用于电商、影像、内容创作和企业数字化场景。 绘画与设计 # AI平台 # AI开放平台
Snack Prompt Snack Prompt 是一个面向提示词工程师和 AI 开发者的社区平台,提供 AI 提示词、图像和自动化内容的发现、分享与再创作功能。用户可以浏览社区贡献的提示词资源,获取适用于不同 AI 工具和场景的创作灵感,也可发布和改编已有内容,提升 AI 应用构建与工作流设计效率。该网站适合关注提示词工程、生成式 AI、AI 自动化和创意内容生产的用户参考使用。 开源与社区 # AI社区 # AI自动化
Generrated Generrated 是一个面向 AI 图像创作与提示词参考的网站,收录约 9,300 张使用 DALL·E 生成的图片,可作为图像生成灵感、提示词学习和创意参考资源。用户可通过浏览不同生成结果,了解文本提示与图像效果之间的关系,适合设计师、AI 艺术创作者、内容创作者及对 DALL·E 图像生成感兴趣的用户使用。 灵感发现 # AI绘画 # AI艺术