MiniGPT-4使用 LLM 增强视觉语言理解

0获赞0粉丝0关注
MiniGPT-4 可使用高级大型语言模型增强视觉语言理解。MiniGPT-4 仅使用一个投影层将来自 BLIP-2 的冻结视觉编码器与冻结 LLM
简介
MiniGPT-4 可使用高级大型语言模型增强视觉语言理解。MiniGPT-4 仅使用一个投影层将来自 BLIP-2 的冻结视觉编码器与冻结 LLM Vicuna 对齐。MiniGPT-4 的训练分两个阶段:第一个传统预训练阶段使用 4 个 A100 在 10 小时内使用大约 500 万个对齐的图像... 更多
其它信息
地区
不详
开发语言
Python
开源组织
所属分类
神经网络/人工智能、 计算机视觉库/人脸识别
授权协议
BSD 3-Clause
操作系统
跨平台
收录时间
2023-09-25
软件类型
开源软件
适用人群
未知

时光轴

里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
图片
表情
全部评价( 0)
推荐率 100%
推荐