PaddlePALMNLP 大规模预训练和多任务学习框架-技术圈

PaddlePALMNLP 大规模预训练和多任务学习框架

联合创作 · 2023-09-26 05:26

PaddlePALM (PArallel Learning from Multi-tasks) 是一个灵活，通用且易于使用的 NLP 大规模预训练和多任务学习框架。 PALM 是一个旨在快速开发高性能 NLP 模型的上层框架。

## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

使用 PaddlePALM，可以非常轻松灵活地探索具有多种任务辅助训练的“高鲁棒性”阅读理解模型。

除了降低 NLP 研究成本以外，PaddlePALM 已被应用于“百度搜索引擎”，有效的提高了用户查询的理解准确度和挖掘出的答案质量，具备高可靠性和高训练/推理性能。

特点:

易于使用：使用 PALM， 8 个步骤即可实现一个典型的 NLP 任务。此外，模型主干网络、数据集读取工具和任务输出层已经解耦，只需对代码进行相当小的更改，就可以将任何组件替换为其他候选组件。
支持多任务学习：6 个步骤即可实现多任务学习任务。
支持大规模任务和预训练：可自动利用多 gpu 加速训练和推理。集群上的分布式训练需要较少代码。
流行的NLP骨架和预训练模型：内置多种最先进的通用模型架构和预训练模型（如 BERT、ERNIE、RoBERTa 等）。
易于定制：支持任何组件的定制开发（e.g 主干网络，任务头，读取工具和优化器）与预定义组件的复用，这给了开发人员高度的灵活性和效率，以适应不同的 NLP 场景。

你可以很容易地用较小的代码重新得到很好的结果，涵盖了大多数 NLP 任务，如分类、匹配、序列标记、阅读理解、对话理解等等。

编辑分享