NeurIPS 官方推荐的开源大模型启动套件

共 1609字,需浏览 4分钟

 ·

2024-04-11 09:22

关注 "GitHub精选",设为 " 星标 " 探索有意思的开源项目

大家好,又见面了,我是 GitHub 精选君!

背景介绍

在处于大数据和高性能计算领域的今天,大型语言模型(LLMs)正逐渐成为人工智能领域最有成效的工具之一。然而,尽管 LLMs 在一系列任务中表现出来的微妙性和宽广的知识使其非常强大,但是它们的部署和实施却很复杂。接触到的问题可能包括:需要处理大量的数据,需要大量的计算能力,对内存和存储需求较高,模型微调和部署的复杂性等。同时,我们也需要一个一站式的解决方案,可以方便地查找和实现不同的模型,这样可以节省我们的时间并提高工作效率。

今天要给大家推荐一个 GitHub 开源项目 Lightning-AI/lit-gpt,该项目在 GitHub 有超过 4.5k Star,用一句话介绍该项目就是:“Hackable implementation of state-of-the-art open-source LLMs based on nanoGPT. Supports flash attention, 4-bit and 8-bit quantization, LoRA and LLaMA-Adapter fine-tuning, pre-training. Apache 2.0-licensed.”。

4a43b1f1483c3b029c54a274c2638e1e.webp

项目介绍

Lit-GPT 是基于 nanoGPT 的最新的开源大型语言模型的实现方案,支持 flash attention、4-bit 和 8-bit 的量化,LoRA 和 LLaMA-Adapter 进行的微调和预训练。

0247eda78dcdf0d2ebebd6a5aa2fd0c8.webp

Lit-GPT 提供了一种 hackable 的实现方式,它的特点是支持多种流行的模型检查点,比如 EleutherAI Pythia、LMSYS LongChat、Meta AI Code Llama、Microsoft Research Phi 等。该项目通过 Lightning Fabric 进行支持,并且使用 Apache 2.0 的开源许可。

以下是一个具体的使用示例,相应速度还是很快的。

目前支持如下模型:

5ba5a7e8a5c53fd3260154c69f98655a.webp

如何使用

参考如下命令即可安装:

    git clone https://github.com/Lightning-AI/lit-gpt
cd lit-gpt
pip install -r requirements-all.txt

安装好之后,使用如下命令即可开始使用:

    python generate/base.py --prompt "Hello, my name is"
  

项目推介

Lit-GPT 在 2023 年的 NeurIPS Large Language Model Efficiency Challenge 上,即使用一个大型语言模型和一个 GPU 在一天内完成微调的比赛中,获得了大赛的官方推荐,是官方的启动的套件。

8f4eacec6af92fcd857e5ac271c84f8c.webp

以下是该项目 Star 趋势图(代表项目的活跃程度):

d51f60f27c48dfe85775bda874aebaac.webp

更多项目详情请查看如下链接。

开源项目地址:https://github.com/Lightning-AI/lit-gpt

开源项目作者:Lightning-AI

关注我们,一起探索有意思的开源项目。

点击如下卡片后台回复:加群与技术极客们一起交流人工智能、开源项目,一起成长。如果你正在寻求开源项目推广、DevOps、AIGC 大模型、软件开发等领域的付费服务,可参考推文了解详情。

点击 支持一下吧
浏览 15
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报