Xtreme1多模态训练数据平台认领

0粉丝

Xtreme1是一个开源的多模态训练数据平台，支持多格式（图片、点云及2D/3D融合）的数据上传、标注和监管。它能够帮助算法工程师和科学家高效标注数据和训练模型。人工智能生命周期结果可视化，并通过可重复、可管理和自动化来一站式处理机器学习。通过提升数据质量，比如改进数据标签，提高数据标注质量等来提

简介

Xtreme1是一个开源的多模态训练数据平台，支持多格式（图片、点云及2D/3D融合）的数据上传、标注和监管。它能够帮助算法工程师和科学家高效标注数据和训练模型。人工智能生命周期结果可视化，并通过可重复、可管理和自动化来一站式处理机器学习。通过提升数据质量，比如改进数据标签，提高数据标注质量等来提... 更多

技术信息

开源协议

Apache

开发语言

Java TypeScript

操作系统

Windows

软件类型

开源软件

所属分类

神经网络/人工智能、机器学习/深度学习

开源组织

无

地区

国产

适用人群

未知

时光轴

里程碑1

LOG0

2023

09-26

轻识收录

打卡

评价

0.0（满分 10 分）0 个评分

什么是点评分

图片

表情

全部评价( 0)

推荐率 100%

推荐

VLE视觉-语言多模态预训练模型

VLE (Vision-Language Encoder) 是一种基于预训练文本和图像编码器的图像-

VLE视觉-语言多模态预训练模型

VLE (Vision-Language Encoder)是一种基于预训练文本和图像编码器的图像-文本多模态理解模型，可应用于如视觉问答、图像-文本检索等多模态判别任务。特别地，在对语言理解和推理能力

LLaVA端到端训练的大型多模态模型

LLaVA 是一个面向多模态 GPT-4 级别功能构建的大型语言和视觉助手。代表了一种端到端训练的大

LLaVA端到端训练的大型多模态模型

LLaVA是一个面向多模态GPT-4级别功能构建的大型语言和视觉助手。代表了一种端到端训练的大型多模态模型，连接视觉编码器和LLM以实现通用视觉和语言理解。Demo早期实验表明，LLaVA展示了优秀的

ImageBind多模态 AI 模型

ImageBind是支持绑定来自六种不同模态（图像、文本、音频、深度、温度和IMU数据）的信息的AI模型，它将这些信息统一到单一的嵌入式表示空间中，使得机器能够更全面、直接地从多种信息中学习，而无需明

Macaw-LLM多模态语言建模

Macaw-LLM：具有图像、视频、音频和文本集成的多模态语言建模Macaw-LLM是一项探索性的尝试，它通过无缝结合图像、视频、音频和文本数据开创了多模式语言建模，建立在CLIP、Whisper和L

ImageBind多模态 AI 模型

ImageBind 是支持绑定来自六种不同模态（图像、文本、音频、深度、温度和 IMU 数据）的信息

Macaw-LLM多模态语言建模

Macaw-LLM：具有图像、视频、音频和文本集成的多模态语言建模Macaw-LLM 是一项探索性的

VisualGLM-6B多模态对话语言模型

VisualGLM-6B多模态对话语言模型

VisualGLM-6B多模态对话语言模型

VisualGLM-6B是一个开源的，支持图像、中文和英文的多模态对话语言模型，语言模型基于ChatGLM-6B，具有62亿参数；图像部分通过训练BLIP2-Qformer构建起视觉模型与语言模型的桥