PaddlePALMNLP 大规模预训练和多任务学习框架
PaddlePALM (PArallel Learning from Multi-tasks) 是一个灵活,通用且易于使用的 NLP 大规模预训练和多任务学习框架。 PALM 是一个旨在快速开发高性能 NLP 模型的上层框架。
## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle
## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
使用 PaddlePALM,可以非常轻松灵活地探索具有多种任务辅助训练的“高鲁棒性”阅读理解模型。
除了降低 NLP 研究成本以外,PaddlePALM 已被应用于“百度搜索引擎”,有效的提高了用户查询的理解准确度和挖掘出的答案质量,具备高可靠性和高训练/推理性能。
特点:
- 易于使用:使用 PALM, 8 个步骤即可实现一个典型的 NLP 任务。此外,模型主干网络、数据集读取工具和任务输出层已经解耦,只需对代码进行相当小的更改,就可以将任何组件替换为其他候选组件。
- 支持多任务学习:6 个步骤即可实现多任务学习任务。
- 支持大规模任务和预训练:可自动利用多 gpu 加速训练和推理。集群上的分布式训练需要较少代码。
- 流行的NLP骨架和预训练模型:内置多种最先进的通用模型架构和预训练模型(如 BERT、ERNIE、RoBERTa 等)。
- 易于定制:支持任何组件的定制开发(e.g 主干网络,任务头,读取工具和优化器)与预定义组件的复用,这给了开发人员高度的灵活性和效率,以适应不同的 NLP 场景。
你可以很容易地用较小的代码重新得到很好的结果,涵盖了大多数 NLP 任务,如分类、匹配、序列标记、阅读理解、对话理解等等。
评论