悟道双语多模态大语言模型认领

0粉丝

“悟道”是双语多模态预训练模型，规模达到 1.75 万亿参数。项目现有 7 个开源模型成果，模型参数文件需到悟道平台进行下载申请。图文类CogViewCogView参数量为40亿，模型可实现文本生成图像，经过微调后可实现国画、油画、水彩画、轮廓画等图像生成。目前在公认MS COCO文生图任务上取得了

简介

“悟道”是双语多模态预训练模型，规模达到 1.75 万亿参数。项目现有 7 个开源模型成果，模型参数文件需到悟道平台进行下载申请。图文类CogViewCogView参数量为40亿，模型可实现文本生成图像，经过微调后可实现国画、油画、水彩画、轮廓画等图像生成。目前在公认MS COCO文生图任务上取得了... 更多

技术信息

开源协议

未知

开发语言

C/C++ Python

操作系统

跨平台

软件类型

开源软件

所属分类

神经网络/人工智能、 LLM（大语言模型）

开源组织

无

地区

国产

适用人群

未知

时光轴

里程碑1

LOG0

2023

09-25

轻识收录

打卡

评价

0.0（满分 10 分）0 个评分

什么是点评分

图片

表情

全部评价( 0)

推荐率 100%

推荐

mPLUG-Owl多模态大语言模型

阿里达摩院提出的多模态GPT的模型：mPLUG-Owl，基于 mPLUG 模块化的多模态大语言模型。

mPLUG-Owl多模态大语言模型

阿里达摩院提出的多模态GPT的模型：mPLUG-Owl，基于 mPLUG 模块化的多模态大语言模型。它不仅能理解推理文本的内容，还可以理解视觉信息，并且具备优秀的跨模态对齐能力。论文：https://

VisualGLM-6B多模态对话语言模型

VisualGLM-6B多模态对话语言模型

VisualGLM-6B多模态对话语言模型

VisualGLM-6B是一个开源的，支持图像、中文和英文的多模态对话语言模型，语言模型基于ChatGLM-6B，具有62亿参数；图像部分通过训练BLIP2-Qformer构建起视觉模型与语言模型的桥

CPM-Bee中英文双语大语言模型

CPM-Bee是一个完全开源、允许商用的百亿参数中英文基座模型。它采用Transformer自回归架构（auto-regressive），使用万亿级高质量语料进行预训练，拥有强大的基础能力。CPM-B

VLE视觉-语言多模态预训练模型

VLE (Vision-Language Encoder) 是一种基于预训练文本和图像编码器的图像-

CPM-Bee中英文双语大语言模型

CPM-Bee 是一个完全开源、允许商用的百亿参数中英文基座模型。它采用 Transformer

VLE视觉-语言多模态预训练模型

VLE (Vision-Language Encoder)是一种基于预训练文本和图像编码器的图像-文本多模态理解模型，可应用于如视觉问答、图像-文本检索等多模态判别任务。特别地，在对语言理解和推理能力

Macaw-LLM多模态语言建模

Macaw-LLM：具有图像、视频、音频和文本集成的多模态语言建模Macaw-LLM是一项探索性的尝试，它通过无缝结合图像、视频、音频和文本数据开创了多模式语言建模，建立在CLIP、Whisper和L

Macaw-LLM多模态语言建模

Macaw-LLM：具有图像、视频、音频和文本集成的多模态语言建模Macaw-LLM 是一项探索性的