CodeFuse-MFTCoder多任务微调代码大模型

联合创作 · 2023-09-26 00:13

Codefuse-MFTCoder是一个开源的多任务代码大语言模型项目，包含代码大模型的模型、数据、训练等。

项目框架

项目优势

多任务：一个模型同时支持多个任务，会保证多个任务之间的平衡，甚至可以泛化到新的没有见过的任务上去；
多模型：支持最新的多个开源模型，包括gpt-neox，llama，llama-2，baichuan，Qwen，chatglm2等；
多框架：同时支持HuggingFace 和ATorch 框架；
高效微调：支持LoRA和QLoRA，可以用很少的资源去微调很大的模型，且训练速度能满足几乎所有微调场景；

本项目主要内容如下：

同时支持单任务SFT(Supervised FineTuning)和MFT(Multi-task FineTuning), 当前开源支持数据均衡，未来将持续开源难易均衡，收敛均衡等
支持QLoRA低成本高效指令微调、LoRA高效指令微调。
支持绝大部分主流的开源大模型，重点关注代码能力优秀的开源大模型，如Qwen, GPT-Neox, Starcoder, Codegeex2, Code-LLaMA等。
支持lora与base model进行权重合并，推理更便捷。
整理并开源2个指令微调数据集：Evol-instruction-66k和CodeExercise-Python-27k。
开源2个[Codefuse系列指令微调模型权重]：CodeFuse-13B和CodeFuse-CodeLlama-34B。

浏览 18

点赞

收藏

分享

举报

评论

图片

表情

TigerBot多语言多任务大语言模型

TigerBot 是一个多语言多任务的大规模语言模型 (LLM)。根据 OpenAI Instruc

TigerBot多语言多任务大语言模型

TigerBot是一个多语言多任务的大规模语言模型(LLM)。根据OpenAIInstructGPT论文在公开NLP数据集上的自动评测，TigerBot-7B达到OpenAI同样大小模型的综合表现的9

大模型LLM微调经验总结&项目更新

大模型LLM-微调经验分享&总结

阿泽的学习笔记

如何对大模型有效地微调增强?

▼ 最近直播超级多，预约保你有收获今晚直播：《基于LoRA微调大模型应用实战》 —1 — 如何对 LLM 大模型增强？对 LLM 大模型能力增强在企业级有两种实践路线：RAG 和 Fine-tuning。接下来我们详细剖析下这两...

大模型指令微调-技巧篇（NEFT）

多任务学习模型ESMM原理与实现（附代码）

万字长文总结大模型微调技能图谱

随着大模型的飞速发展，在短短一年间就有了大幅度的技术迭代更新，从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等，几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能，并

CodeFuse-13B代码大语言模型

CodeFuse-13B是基于GPT-NeoX框架训练的13B参数代码生成模型，能够处理4096个字

CodeFuse-13B代码大语言模型

CodeFuse-13B是基于GPT-NeoX框架训练的13B参数代码生成模型，能够处理4096个字符的代码序列。该模型在1000BToken的代码、中文、英文数据数据集上进行预训练，覆盖超过40种编