ChatGLM Efficient Tuning基于 PEFT 的高效 ChatGLM 微调

联合创作 · 2023-09-25 23:54

ChatGLM Efficient Tuning 是基于 PEFT 的高效 ChatGLM-6B 微调。

目前实现了针对以下数据集的支持：

Stanford Alpaca
Stanford Alpaca (Chinese)
GPT-4 Generated Data
BELLE 2M
BELLE 1M
BELLE 0.5M
BELLE Dialogue 0.4M
BELLE School Math 0.25M
BELLE Multiturn Chat 0.8M
Guanaco Dataset
Firefly 1.1M
CodeAlpaca 20k
Alpaca CoT
Web QA (Chinese)
UltraChat
WebNovel (Chinese)

使用方法参考 data/README.md 文件。

部分数据集的使用需要确认，推荐使用下述命令登录你的 HuggingFace 账户。

pip install --upgrade huggingface_hub
huggingface-cli login

微调方法

目前实现了针对以下高效微调方法的支持：

LoRA
- 仅微调低秩适应器。
P-Tuning V2
- 仅微调前缀编码器。
Freeze Tuning
- 仅微调后几层的全连接层。
全量微调
- 微调模型所有参数。

软件依赖

Python 3.8+, PyTorch 1.13.1
Transformers, Datasets, Accelerate, PEFT, TRL
protobuf, cpm-kernels, sentencepiece
jieba, rouge-chinese, nltk（用于评估）
gradio, matplotlib（用于网页端交互）
uvicorn, fastapi, sse-starlette（用于 API）

以及 强而有力的 GPU！

微调 ChatGLM 的例子

训练结果

使用整个 alpaca_gpt4_zh 数据集微调 ChatGLM 模型，使用秩为 8 的 LoRA 方法，使用默认超参数进行单轮训练。下图为训练损失变化曲线。

评估结果

选择 alpaca_gpt4_zh 数据集中的前一百条数据来评估微调后的 ChatGLM 模型，并计算 BLEU 和中文 ROUGE 分数。下表为评估结果。

分数	原版模型	FZ (l=2)	PT (p=16)	LoRA (r=8)
BLEU-4	15.75	16.85	16.06	17.01 (+1.26)
Rouge-1	34.51	36.62	34.80	36.77 (+2.26)
Rouge-2	15.11	17.04	15.32	16.83 (+1.72)
Rouge-l	26.18	28.17	26.35	28.86 (+2.68)
训练参数	/	4.35%	0.06%	0.06%

FZ：Freeze 微调，PT：P-Tuning V2 微调（为了与 LoRA 公平比较，我们使用了 pre_seq_len=16），训练参数：可训练参数占全部参数的百分比。

浏览 27

点赞

收藏

分享

举报

评论

图片

表情

如何用清华 ChatGLM 微调一个私域大模型

曹政，曹大是我们圈子里公认的大佬。他在技术上不仅早早领先，在思维认知领域更是帮助很多小伙伴快速成长。

ChatGLM 金融大模型决赛方案总结

ChatGLM 金融大模型决赛方案总结

阿泽的学习笔记

QLoRA量化 LLM 的高效微调

QLoRA是华盛顿大学提出的一种有效的微调方法，可以减少内存使用量，足以在单个48GBGPU上微调65B参数模型，同时保留完整的16位微调任务性能。QLoRA通过冻结的4位量化预训练语言模型将梯度反向

QLoRA量化 LLM 的高效微调

QLoRA 是华盛顿大学提出的一种有效的微调方法，可以减少内存使用量，足以在单个 48GB GPU

基于激光雷达的高效语义SLAM

小白学视觉

BigCache基于 Go 的高效缓存

BigCache是用于在Go中写入千兆字节数据的高效缓存。快速，并发，逐行扫描内存缓存，以保持大量条目，而不影响性能。BigCache在堆上保留条目，但为它们省略了GC。要实现对字节数组的操作，因此在

BigCache基于 Go 的高效缓存

BigCache 是用于在 Go 中写入千兆字节数据的高效缓存。快速，并发，逐行扫描内存缓存，以保持

本草基于中文医学知识的 LLaMA 微调模型

本草【原名：华驼(HuaTuo)】是基于中文医学知识的 LLaMA 微调模型。此项目开源了经过中文医

WizardLM基于 LLaMA 的微调大语言模型

WizardLM是一个经过微调的7BLLaMA模型。它通过大量具有不同难度的指令跟随对话进行微调。这个模型的新颖之处在于使用了LLM来自动生成训练数据。WizardLM模型使用一种名为Evol-Ins