搜索
下载APP
QLoRA量化 LLM 的高效微调
认领
关注
0
粉丝
QLoRA 是华盛顿大学提出的一种有效的微调方法,可以减少内存使用量,足以在单个 48GB GPU 上微调 65B 参数模型,同时保留完整的 16 位
知识
简介
QLoRA 是华盛顿大学提出的一种有效的微调方法,可以减少内存使用量,足以在单个 48GB GPU 上微调 65B 参数模型,同时保留完整的 16 位微调任务性能。QLoRA 通过冻结的 4 位量化预训练语言模型将梯度反向传播到低阶适配器 (LoRA)。项目团队同时还发布了一个命名为 Guanaco...
更多
其它信息
授权协议
MIT
开发语言
Python
操作系统
跨平台
软件类型
开源软件
所属分类
神经网络/人工智能、 LLM(大语言模型)
开源组织
无
地区
不详
适用人群
未知
时光轴
里程碑
1
LOG
0
2023
09-25
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
10分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
ChatGLM Efficient Tuning基于 PEFT 的高效 ChatGLM 微调
ChatGLM Efficient Tuning 是基于 PEFT 的高效 ChatGLM-6B 微
ChatGLM Efficient Tuning基于 PEFT 的高效 ChatGLM 微调
ChatGLMEfficientTuning 是基于 PEFT 的高效 ChatGLM-6B 微调。目前实现了针对以下数据集的支持:StanfordAlpacaStanfordAlpaca(Chine
BLOOMChat176B 的多语言聊天 LLM
BLOOMChat是一个1760亿参数的多语言聊天模型。它是由BLOOM(176B)在助理式的对话数据集上进行指导调整的,并支持多种语言的对话、问题回答和生成性答案。BLOOMChat是一个新的、开放
BLOOMChat176B 的多语言聊天 LLM
BLOOMChat176B 的多语言聊天 LLM
0
LanceML 和 LLM 的列式数据格式
Lance是一种现代的列式数据格式,针对ML工作流和数据集进行了优化。只需两行代码即可从parquet转换为100倍更快的随机访问、向量索引、数据版本控制等。与pandas、duckdb、polars
LanceML 和 LLM 的列式数据格式
Lance 是一种现代的列式数据格式,针对 ML 工作流和数据集进行了优化。只需两行代码即可从 pa
Marsha基于 LLM 的编程语言
Marsha是一种基于LLM的编程语言。用简单的语法描述你想要完成的任务,提供使用示例,Marsha编译器将指导LLM生成经过测试的Python软件。可通过终端或JupyterNotebook使用pi
Marsha基于 LLM 的编程语言
Marsha 是一种基于 LLM的编程语言。用简单的语法描述你想要完成的任务,提供使用示例,Mars
AudioGPT基于 LLM 的音频助手
AudioGPT是一个借助大语言模型(LLM)处理音频的工具。AudioGPT在收到用户请求时使用ChatGPT进行任务分析,根据语音基础模型中可用的功能描述选择模型,用选定的语音基础模型执行用户指令
LangChain构建 LLM 应用的工具
LangChain是一个用于构建基于大型语言模型(LLM)的应用程序的库。它可以帮助开发者将LLM与其他计算或知识源结合起来,创建更强大的应用程序。LangChain提供了以下几个主要模块来支持这些应
10分