MiniMax-01

联合创作 · 2025-02-18 07:49

MiniMax-Text-01 是一个功能强大的语言模型,参数量高达4560亿,其中单次激活459亿

为了更好地释放该模型的长语境能力,MiniMax-Text-01 采用了一种混合架构,该架构结合了 Lightning Attention、Softmax Attention 和 Mixture-of-Experts (MoE)。

浏览 3
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报