大模型落地最后一公里:111页全面综述大模型评测
机器学习初学者
共 7617字,需浏览 16分钟
· 2023-11-09
机器之心专栏
机器之心编辑部
-
论文地址:https://arxiv.org/abs/2310.19736 -
论文参考文献详细列表:https://github.com/tjunlp-lab/Awesome-LLMs-Evaluation-Papers
图 5 大模型安全评测
图 6 行业大模型评测
往期精彩回顾
交流群
欢迎加入机器学习爱好者微信群一起和同行交流,目前有机器学习交流群、博士群、博士申报交流、CV、NLP等微信群,请扫描下面的微信号加群,备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~(也可以加入机器学习交流qq群772479961)
评论
性能提升,星辰AI大模型TeleChat-12B评测
0x0. 前言2月份的时候评测过TeleChat-7B大模型,见星辰AI大模型TeleChat-7B评测。最近中电信 AI 科技有限公司针对TeleChat-7B进行了性能升级,并开源了一个更大的模型TeleChat-12B,受邀对这个大模型进行新的评测。本文主要关注TeleChat-7B在做一些文
GiantPandaCV
0
综述 | 多模态 LLM,大模型的未来
本文来源 机器之心编辑部 多模态大型语言模型进展如何? 盘点 26 个当前最佳多模态大型语言模型。 当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转移,于是乎,让 LLM 具备多模态能力的多模态大型语言模...
机器学习与生成对抗网络
0
FlagAI大模型工具包
FlagAI飞智是一个快速、易于使用和可扩展的大模型工具包。目标是支持在多模态的各种下游任务上训练、微调和部署大规模模型。优点:可通过API快速下载模型提供API方便你快速下载模型,并在给定(中/英文
FlagAI大模型工具包
0
RedPajama大语言模型
RedPajama项目旨在创建一套领先的全开源大语言模型。目前,该项目已完成了第一步,成功复制了LLaMA训练数据集超过1.2万亿个数据token。该项目由Together、Ontocord.ai、E
RedPajama大语言模型
0