Tencent ML-Images大规模多标签图像数据集

联合创作 · 2023-09-29 16:15

Tencent ML-Images 由多标签图像数据集 ML-Images 与业内目前同类深度学习模型中精度最高的深度残差网络 ResNet-101 构成。

ML-Images: 最大的开源多标签图像数据库，包括 17,609,752 个训练集和 88,739 个验证图像 URL，最多可标注 11,166 个类别。

Resnet-101 model: 在 ML-Images 上进行了预训练，并通过迁移学习在 ImageNet 上实现了 top-1 精度 80.73%。

该项目的主要内容包括：

ML-Images 数据集的全部图像 URL，以及相应的类别标注。出于原始图像版权的考虑，此次开源将不直接提供原始图像，用户可利用我们提供的下载代码和 URL 自行下载图像。

ML-Images 数据集的详细介绍，包括图像来源、图像数量、类别数量、类别的语义标签体系，标注方法，以及图像的标注数量等统计量。

完整的代码和模型。提供的代码涵盖从图像下载，图像预处理，基于 ML-Images 的预训练，基于 ImageNet 的迁移学习，到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例，以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的 ResNet-101 模型(在单标签基准数据集 ImageNet 的验证集上的 top-1 精度为 80.73%)。用户可根据自身需求，随意选用该项目的代码或模型。

浏览 16

点赞

收藏

分享

举报

评论

图片

表情

多标签图像分类综述

小白学视觉

基于Keras的多标签图像分类

机器学习AI算法工程

MapReduce大规模数据集软件架构

MapReduce是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念"Map（映射）"和"Reduce（化简）"，和他们的主要思想，都是从函数式编程语言借来的，还有从矢量

Apache Fluo大规模数据集增量处理系统

ApacheFluo是 GooglePercolator（搜索索引）的开源实现，允许用户对存储在ApacheAccumulo中的大型数据集进行增量更新，而无需重新处理所有的数据。与批处理和流处理框架不

医学图像开源数据集汇总

小白学视觉

ALITA:用于自动驾驶的大规模增量数据集

JImageTaglib图像处理标签库

JImageTaglib是个用来处理图片的的标签，在服务器中生成响应的处理图片，可以对图片进行过滤（如转灰度图，边缘查找等）另外还可以用来生成条形码。使用方法实例：<jit:imagesrc="

JImageTaglib图像处理标签库

JImageTaglib是个用来处理图片的的标签，在服务器中生成响应的处理图片，可以对图片进行过滤（

【机器学习】小数据集怎么上分? 几行代码生成伪标签数据集

机器学习初学者

Cloudata分布式大规模数据存储

Cloudata 是一个分布式的大规模结构化数据存储解决方案，是 Google Bigtable 的

点赞

收藏

分享

举报