书生·浦语多语言大型语言模型

联合创作 · 2023-09-25 23:43

InternLM（书生·浦语）是在过万亿 token 数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练，InternLM 基座模型具有较高的知识水平，在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀，在多种面向人类设计的综合性考试中表现突出。在此基础上，通过高质量的人类标注对话数据结合 RLHF 等技术，使得 InternLM 可以在与人类对话时响应复杂指令，并且表现出符合人类道德与价值观的回复。

基于 InternLM 训练框架，发布了两个开源预训练模型 InternLM-7B 和 InternLM-20B。

模型亮点

多语。InternLM 具备多种语言的理解和表达能力，尤其能熟练使用中英双语，在中文和英文的多种客观评测上都强于社区开源模型
推理。通过在不同来源的数据以及精选高质量数据上进行训练，InternLM 在逻辑推理、代码生成以及复杂指令跟随等方面表现出色
考试。使用人类考试数据作为验证模型能力的试金石。InternLM 在 MMLU、C-Eval 等考试评测集上性能优异，特别是在各项中文考试中获得了超越ChatGPT的分数

评测结果

InternLM 可以在 MMLU、AGIEval、C-Eval 以及 GAOKAO-bench 等涵盖了不同语言以及学科的考试基准集上取得不错的分数，在多个基准集得分超过 ChatGPT

MMLU

AGIEval

C-Eval

GAOKAO-bench

英文测评

在来源广泛的英语语料上进行预训练后，InternLM 在多种不同的英文学术评测集上性能优异，例如知识性问答、阅读理解以及数学推理等

中文测评

通过在各种中文语料上进行预训练，InternLM 不但可以熟练使用中文，同时在中文俗语理解、阅读理解、关键词抽取等客观评测任务上也取得非常不错的性能

浏览 37

点赞

收藏

分享

举报

评论

图片

表情

MPT-30B大型语言模型

MPT-30B是MosaicPretrainedTransformer(MPT)模型系列的一部分，它使用了一个为高效训练和推理而优化的transformer架构，并在1Ttokens的英文文本和代码上

TigerBot多语言多任务大语言模型

TigerBot 是一个多语言多任务的大规模语言模型 (LLM)。根据 OpenAI Instruc

TigerBot多语言多任务大语言模型

TigerBot是一个多语言多任务的大规模语言模型(LLM)。根据OpenAIInstructGPT论文在公开NLP数据集上的自动评测，TigerBot-7B达到OpenAI同样大小模型的综合表现的9

XVERSE-13B支持多语言的大语言模型

XVERSE-13B 是由深圳元象科技自主研发的支持多语言的大语言模型（Large Language

XVERSE-13B支持多语言的大语言模型

XVERSE-13B 是由深圳元象科技自主研发的支持多语言的大语言模型（LargeLanguageModel），主要特点如下：模型结构：XVERSE-13B使用主流Decoder-only的标准Tra

GPT-2基于 transformer 的大型语言模型

GPT-2是一种基于transformer 的大型语言模型，具有15亿个参数，在800万网页数据集上进行训练。它是论文《语言模型是无人监督的多任务学习者》（LanguageModelsareUnsup

PaLM 2谷歌下一代大型语言模型

PaLM2 是谷歌推出的下一代大型语言模型。擅长高级推理任务，包括代码和数学、分类和问答、翻译和多语言能力以及自然语言生成。谷歌声称PaLM2是一种最先进的语言模型，要优于其之前所有的LLM，包括Pa

GPT-2基于 transformer 的大型语言模型

GPT-2 是一种基于 transformer 的大型语言模型，具有 15 亿个参数，在 800 万

PaLM 2谷歌下一代大型语言模型

PaLM 2 是谷歌推出的下一代大型语言模型。擅长高级推理任务，包括代码和数学、分类和问答、翻译和多

LoRA大型语言模型的低秩适应

LoRA是 Low-RankAdaptationofLargeLanguageModels的简写，即大型语言模型的低秩适应。它冻结了预训练模型的权重，并将可训练的秩分解矩阵注入到Transformer

点赞

收藏

分享

举报