WizardLM基于 LLaMA 的微调大语言模型
WizardLM 是一个经过微调的 7B LLaMA 模型。它通过大量具有不同难度的指令跟随对话进行微调。这个模型的新颖之处在于使用了 LLM 来自动生成训练数据。
WizardLM 模型使用一种名为 Evol-Instruct(是一种使用 LLM 代人类自主批生成各种难度等级和技术范围的开放指令,以提高 LLM 能力的新方法)的新方法,通过 70k 个计算机生成的指令进行训练,该方法生成具有不同难度级别的指令。
Evol-Instruct 使用以下五个操作来扩展提示:
-
添加约束
-
深化
-
具体化
-
增加推理步骤
-
复杂输入
这些操作按顺序应用于初始指令以使其更加复杂,回复由 LLM 生成。
评论