卧槽!国内还有这样的数据搜索网站!

数据管道

共 1607字,需浏览 4分钟

 ·

2020-09-27 13:08

大家好,我是宝器!

好的数据,对模型训练至关重要。有时候自己Fake数据,挺费时费力的,但有些现成的数据集,挺不好找也不好下载,更别说使用了。

之前写过一片文章,世界上最有价值的不是石油而是数据,文章里面宝器推荐了挺多涵盖各类型数据集网站,但都不是很全的。

BUT,不用慌。

最近我发现了一个国内的数据集搜索网站Graviti Open Dataset,下面简单介绍一下我的体验过程。

01
在这里你可以干什么?

在Graviti ,你不仅可以很方便的搜索你想要的数据,更可以在线预览样例数据、标注、标签,甚至对于国外的数据不需要“翻墙”、可高速免费下载
下面将对其进行一个详细的介绍:

数据种类多
Graviti 收录了 400 多个高质量数据集,覆盖无人驾驶、智慧零售、机器人等多种AI应用领域。举两个例子:

无人驾驶类

CityScapes (Semantic Understanding of Urban Street Scenes):

https://www.graviti.cn/open-datasets/dataset-detail/CityScapes

BDD100K (A Diverse Driving Dataset for Heterogeneous Multitask Learning):

https://www.graviti.cn/open-datasets/dataset-detail/BDD100K


文字识别类

MNIST (Handwritten digits): 

https://www.graviti.cn/open-datasets/dataset-detail/MNIST

SVHN (The Street View House Numbers): 

https://www.graviti.cn/open-datasets/dataset-detail/SVHN

 
►查找方便
不仅种类多,还方便搜索,可以按应用行业 , 标注类型进行筛选!举个例子,查找一个自动驾驶类的数据集,直接在搜索框输入‘auto’。

 
数据集详情页,除了详细的介绍以外,数据概要(包含数据格式、数据量、大小)、发布方、标注方也是一应俱全,一目了然。


►数据可视化
除了整合数据集信息以外,在线可视化也是亮点!无需下载直接可以浏览样例数据,标注、标签同样可以轻松在线查看。甚至,提供了数据分布:


►免费高速下载
除了以上两个优点之外,下载速度应该是许多小伙伴最关注的,特别是在下载一些国外大型数据集的时候,简直是国内小伙伴的梦魇,

在 Graviti 获取数据集可以不用找梯子!不用再受网速限制!需进入数据集详情页,点击即可获取数据集,期间不用花费任何费用!以下为亲测下载速度

 
02
涉及领域

目前这款产品覆盖众多应用场景,比如智能交通、智能零售、社交娱乐等等,可以助力突破现有业务模型。

 
有的小伙伴会问了,说了半天还不赶紧把入口贴出来

友情分享Graviti网站链接:www.graviti.cn/open-datasets

如果你懒得复制链接,宝器也为你准备了二维码入口,可以扫码直接体现一番。


后来宝器问了下这款产品的产品经理,如果在他们网站发现自己感兴趣的数据不存在怎么办,回复是:可以先进他们的微信群反馈,之后尽快给上线。

他们的官方企业微信群如下:

 
另外,除了托管公开标准的数据集,该网站正在开发针对用户的个性化的数据管理服务,包括数据免费托管,数据版本管理,在线可视化!还可以轻松地完成数据的拆分与合并!这对于开发自己数据集的同学无疑是个非常值得期待的功能。


为方便大家体验,可阅读原文。
浏览 74
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报