搜索
下载APP
Xtreme1多模态训练数据平台
认领
关注
0
粉丝
Xtreme1是一个开源的多模态训练数据平台,支持多格式(图片、点云及2D/3D融合)的数据上传、标注和监管。它能够帮助算法工程师和科学家高效标注数据
知识
简介
Xtreme1是一个开源的多模态训练数据平台,支持多格式(图片、点云及2D/3D融合)的数据上传、标注和监管。它能够帮助算法工程师和科学家高效标注数据和训练模型。 人工智能生命周期结果可视化,并通过可重复、可管理和自动化来一站式处理机器学习。通过提升数据质量,比如改进数据标签,提高数据标注质量等来提...
更多
其它信息
授权协议
Apache
开发语言
Java TypeScript
操作系统
Windows
软件类型
开源软件
所属分类
神经网络/人工智能、 机器学习/深度学习
开源组织
无
地区
国产
适用人群
未知
时光轴
里程碑
1
LOG
0
2023
09-26
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
10分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
VLE视觉-语言多模态预训练模型
VLE (Vision-Language Encoder) 是一种基于预训练文本和图像编码器的图像-
VLE视觉-语言多模态预训练模型
VLE (Vision-Language Encoder)是一种基于预训练文本和图像编码器的图像-文本多模态理解模型,可应用于如视觉问答、图像-文本检索等多模态判别任务。特别地,在对语言理解和推理能力
LLaVA端到端训练的大型多模态模型
LLaVA 是一个面向多模态 GPT-4 级别功能构建的大型语言和视觉助手。代表了一种端到端训练的大
LLaVA端到端训练的大型多模态模型
LLaVA是一个面向多模态GPT-4级别功能构建的大型语言和视觉助手。代表了一种端到端训练的大型多模态模型,连接视觉编码器和LLM以实现通用视觉和语言理解。Demo早期实验表明,LLaVA展示了优秀的
ImageBind多模态 AI 模型
ImageBind是支持绑定来自六种不同模态(图像、文本、音频、深度、温度和IMU数据)的信息的AI模型,它将这些信息统一到单一的嵌入式表示空间中,使得机器能够更全面、直接地从多种信息中学习,而无需明
Macaw-LLM多模态语言建模
Macaw-LLM:具有图像、视频、音频和文本集成的多模态语言建模Macaw-LLM是一项探索性的尝试,它通过无缝结合图像、视频、音频和文本数据开创了多模式语言建模,建立在CLIP、Whisper和L
ImageBind多模态 AI 模型
ImageBind 是支持绑定来自六种不同模态(图像、文本、音频、深度、温度和 IMU 数据)的信息
Macaw-LLM多模态语言建模
Macaw-LLM:具有图像、视频、音频和文本集成的多模态语言建模Macaw-LLM 是一项探索性的
VisualGLM-6B多模态对话语言模型
VisualGLM-6B多模态对话语言模型
0
VisualGLM-6B多模态对话语言模型
VisualGLM-6B是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于ChatGLM-6B,具有62亿参数;图像部分通过训练BLIP2-Qformer构建起视觉模型与语言模型的桥
10分