GPT2GPT-2 训练实现

联合创作 · 2023-09-25 21:33

非官方 GPT-2 训练实现,支持 GPU 和 TPU。

GPT-2 是一种基于  transformer 的大型语言模型,具有 15 亿个参数,在 800 万网页数据集上进行训练。

依赖:

GPU

pip3 install tensorflow-gpu regex

TPU

pip3 install tensorflow regex google-api-python-client oauth2client

下载模型

pip3 install requests tqdm

生成数据集

pip3 install ftfy tqdm newspaper3k

浏览 17
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报