LongLLaMA加强版 LLaMA 模型

0粉丝
LongLLaMA 是一个能够处理长上下文的大型语言模型,能够处理 256k tokens 甚至更多的长上下文。它基于 OpenLLaMA 并使用 Focused Transformer (FoT) 方法进行微调。开发团队在 Apache 2.0 许可下发布了 LongLLaMA 模型的较小 3B
简介
LongLLaMA 是一个能够处理长上下文的大型语言模型,能够处理 256k tokens 甚至更多的长上下文。它基于 OpenLLaMA 并使用 Focused Transformer (FoT) 方法进行微调。开发团队在 Apache 2.0 许可下发布了 LongLLaMA 模型的较小 3B... 更多
其它信息
授权协议
Apache-2.0
开发语言
Python
操作系统
跨平台
软件类型
开源软件
所属分类
神经网络/人工智能、 LLM(大语言模型)
开源组织
地区
不详
适用人群
未知

时光轴

里程碑1
LOG0
2023
09-26
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
图片
表情
全部评价( 0)
推荐率 100%
推荐