OpenChatKit聊天机器人工具套件

联合创作 · 2023-09-25 21:45

OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。

OpenChatKit 工具包包括一个指令调优的200亿参数语言模型、一个60亿参数调节模型和一个可扩展的检索系统,该检索系统用于包含来自自定义存储库的最新响应。它接受了OIG-43 M训练数据集的训练

OpenChatKit 包含以下代码:

  • 训练 OpenChatKit 模型
  • 使用模型测试推理
  • 使用来自检索索引的额外上下文来扩充模型

要求

在开始之前,需要安装 PyTorch 和其他依赖项。

  1. 安装Miniconda 
  2. 使用此存储库根目录下的 environment.yml 文件创建名为OpenChatKit的环境。
conda env create -f environment.yml

这个 repo 也使用 Git LFS 来管理一些文件,安装然后运行:

git lfs install

预训练权重

GPT-NeoXT-Chat-Base-20B 是 GPT-NeoX 的 20B 参数变体,在会话数据集上进行了微调。

可以在 Huggingface 上的GPT-NeoXT-Chat-Base-20B模型卡上找到更多详细信息。

数据集

聊天模型是在由LAION TogetherOntocord.ai构建的OIG数据集上训练的

要从 Huggingface 下载数据集,请从存储库的根目录运行以下命令。

python data/OIG/prepare.py

命令完成后,数据将位于data/OIG/files目录中。

数据贡献

通过贡献数据来帮助改进此聊天模型!有关详细信息,请参阅OpenDataHub存储库。

预训练基础模型

如上所述,聊天模型是 Eleuther AI 的 GPT-NeoX-20B 的微调变体。要下载 GPT-NeoX-20B 并准备好进行微调,请从存储库的根目录运行此命令。

python pretrained/GPT-NeoX-20B/prepare.py

该模型的权重在pretrained/GPT-NeoX-20B/EleutherAI_gpt-neox-20b

浏览 2
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报