鹏程·盘古α中文预训练语言模型

联合创作 · 2023-09-25 23:26

鹏程·盘古α是业界首个2000亿参数以中文为核心的预训练生成语言模型，目前开源了两个版本：鹏程·盘古α和鹏程·盘古α增强版，并支持NPU和GPU两个版本，支持丰富的场景应用，在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出，具备较强的少样本学习的能力。

基于盘古系列大模型提供大模型应用落地技术帮助用户高效的落地超大预训练模型到实际场景。整个框架特点如下：

主要有如下几个核心模块：

数据集：从开源开放数据集、common crawl数据集、电子书等收集近80TB原始语料，构建了约1.1TB的高质量中文语料数据集、53种语种高质量单、双语数据集2TB。

基础模块：提供预训练模型库，支持常用的中文预训练模型，包括鹏程·盘古α、鹏程·盘古α增强版等。

应用层：支持常见的NLP应用比如多语言翻译、开放域对话等，支持预训练模型落地工具，包括模型压缩、框架移植、可持续学习，助力大模型快速落地。

浏览 49

点赞

收藏

分享

举报

评论

图片

表情

Chinese BERT中文预训练语言模型

在自然语言处理领域中，预训练语言模型（Pre-trained Language Models）已成为

Chinese BERT中文预训练语言模型

在自然语言处理领域中，预训练语言模型（Pre-trainedLanguageModels）已成为非常重要的基础技术。为了进一步促进中文信息处理的研究发展，我们发布了基于全词遮罩（WholeWordMa

MiniRBT中文小型预训练模型

在自然语言处理领域中，预训练语言模型（Pre-trainedLanguageModels）已成为非常重要的基础技术。为了进一步促进中文信息处理的研究发展，哈工大讯飞联合实验室（HFL）基于自主研发的知

MiniRBT中文小型预训练模型

在自然语言处理领域中，预训练语言模型（Pre-trained Language Models）已成为

【NLP】Pytorch中文语言模型bert预训练代码

ACL2020 Best Paper有一篇论文提名奖，《Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks》。这篇论文做了很多语言模型预训练的实验，系统的分析了语言模型预训练对子任务的效果提升情况。有几...

一文了解预训练语言模型！

博文视点Broadview

首个在线教学中文预训练模型TAL-EduBERT

机器学习AI算法工程

VLE视觉-语言多模态预训练模型

VLE (Vision-Language Encoder) 是一种基于预训练文本和图像编码器的图像-

YaLM 100B千亿参数预训练语言模型

YaLM 100B是一个类似 GPT 的神经网络，用于生成和处理文本。该模型利用了 1000 亿个参

PERT基于 BERT 的预训练语言模型

在自然语言处理领域中，预训练语言模型（Pre-trainedLanguageModels，PLMs）已成为非常重要的基础技术。在近两年，哈工大讯飞联合实验室发布了多种中文预训练模型资源以及相关配套工具

点赞

收藏

分享

举报