1000+高质量数据集免费高速下载!一个好用又丰富的AI公开数据集平台

共 2451字,需浏览 5分钟

 ·

2021-01-28 22:13


它又出来了!它正要发声,忽然嗤的一声,一个弹子从下面射来,它一翻身从树上跌下去。斜刺里两只老鸟箭也似的飞来,接住了它,衔上巢去。它的血从树隙里一滴一滴的落到地上来。

数据、算力、算法被视为推动AI发展的三大要素,其中数据是决定模型质量的关键,更好的数据才能训练出更好的模型。因此,找到高质量数据集是炼丹的第一步

然而,由于开源数据的质量参差不齐、预览困难,且数据量大、下载速度慢,花费九牛二虎之力还是没有遇上“对”的数据集已是家常便饭......你是否期待有一个公开数据集平台能够在线预览原始数据、标注数据、数据标签分布,并支持高速下载?

它已经来了。
Graviti Open Datasets
是一个提供海量公开数据集的平台,可通过应用场景和标注类型,轻松定位到想要的数据集;支持在线预览原始数据、标注数据、数据标签及属性分布;无需“梯子”即可免费高速下载 1000+ 高质量数据集,下载速度高达15MB/s



01

丰富多元的数据集种类

1000+ 优质数据集免费获取

  • 覆盖无人驾驶、文本检测、行为/事件检测、语义分割、姿态估计、场景识别、面部检测、目标追踪、ASR、AR/MR、深度估计等 50+ 种AI应用领域
  • 拥有2D分类、2D多边形、2D矩形等 30+ 种标注任务
  • 支持图像、视频、文本、语音、点云、IMU、3D模型等 10+ 种主流数据格式


02

多维快捷的数据集查找与定位


快速查找数据集

Open Datasets就像一把打开公开数据集的万能钥匙。用户不仅可以通过关键词精准定位心仪数据集,还可以通过数据集名称联想,数据集应用场景、标注类型的筛选进行多维度查找。

一目了然的数据集结构化描述

Open Datasets拥有明晰的信息展示方式,通过将数据的应用场景、标注类型、数据概要信息及协议信息结构化,方便您迅速定位数据关键信息,提高您的阅读体验。


03

清晰高效的数据在线可视化

非结构化数据管理的最大难点之一是“无法在线预览”。用户在下完数据集后还要写代码做数据可视化,常常发现图片格式错误、标注质量差,甚至根本不是自己想要的……
而在Open Datasets,用户可以完美跳过下载步骤,无需另写代码,通过Graviti组件式数据可视化工具在线预览原数据、标注数据、数据特性(数据标签及属性分布)还可以通过COPY预览页面的URL/IFRAME将可视化组件嵌入到自己的页面。


支持列表、柱状图、饼图等多种信息统计方式,提前掌握数据细节,试错成本大幅降低。



04

高速稳定的海外数据下载

针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。和进入海外官网下载相比,Graviti至少提速100%。从此告别令人抓狂的下载报错!

普通带宽下载海外数据,实测就15+MB/s的速度



05

在线获取并使用数据集
协同TensorBay平台赋能开发效率

面对庞杂的非结构化数据信息,如何存储、查询、分析、挖掘和利用就显得尤为关键。传统管理手段已无满足身处复杂数据环境的智能系统/应用的AI开发者。为了帮助AI开发者更高效地迭代模型,而不是将精力耗费在管理数据的工作上,格物钛打造了TensorBay非结构化数据管理SaaS。
用户在Open Datasets获取数据集后,可选择Fork数据集,之后便能在TensorBay对原数据集进行修改,享受一站式数据管理服务:
  • 安全可靠的数据云端托管
  • 清晰可溯的版本管理
  • 便捷高效的数据可视化
  • 赋能开发者团队的数据协同
  • 简单易用的开发者工具


06

完善的数据集社区支持

面对多样化用户需求,Graviti提供问题与需求的反馈渠道,一对一针对性回应、跟进、解决用户对于数据集的需求,以及在数据管理过程中遇到的任何问题。











如果在Graviti官网没有找到自己想要的数据集,或者在TensorBay数据管理上有任何需求,可以去他们的官方微信群进行反馈,说不定下次就为你上线了呢 :)


07

打破数据壁垒,走向合作

人工智能领域的重大技术突破需要依靠开源的形式提升创新质量,开源本质上是一种人才、智慧的聚合,是产业升级的强大助推器。开源数据集将为开发者提供更丰富、全面、高质量的数据应用和参考,特别是对那些缺少资金和渠道来获取可靠数据集的中小开发者,帮助巨大。格物钛希望打造公开数据集平台,在贡献社区的同时,也期待携手更多开发者、商业合作伙伴共同参与社区建设,形成行业标准和最佳实践。

格物钛创始人&CEO 崔运凯

一个永不会终止的倡议

寻集令是格物钛面向全球发起的公开数据集行动倡议,我们希望打造集合无人驾驶、互联网泛娱乐、新零售、智慧城市和在线教育多个领域的AI公开数据集生态联盟,促使数据开源成为一个长期共赢的模式,助力AI行业的高效开发和创新。




加入我们:



享受独家权益

超过100+各类行业媒体的宣传支持,优选合作伙伴专属的独立数据集展示页面更多数据集伙伴的独家联合推广的市场活动支持,策划直播活动,开发者社区数据集宣传等

提高行业影响力

发布的数据集将通过中国各区域人工智能行业协会联合1000+个会员单位推广使用,提升企业在行业内的影响力。Graviti作为面向所有开发者的AI数据服务平台,将触达超过60万的开发者社区,全力帮助企业提高知名度。

拥抱更多合作机遇

我们的数据集将吸引中国人工智能领域的关注,成为我们的一员将助您向更多行业合作伙伴展示您的数据集实力,拥抱更多合作机遇。


寻集令现有合作伙伴一览

公开数据集合作垂询

邮箱:bd@graviti.cn

电话:021-31075066


您希望使用机器学习颠覆行业

我们帮助让机器学习变得简单



▼ 点击阅读原文,直达官网体验
浏览 43
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报