数据工程师生存必备工具!

Datawhale

共 1551字,需浏览 4分钟

 · 2021-09-13

 Datawhale工具 
组件:数据可视化组件
炼丹师在炼丹过程中最头疼的事情是什么?

1、好不容易找到可用数据,但无法直观了解标注质量?

2、想把标注情况可视化展现,却要花费数天分辨千奇百怪的数据格式、写繁杂代码翻过万重山?

3、辛苦劳动后,若是数据可用那还皆大欢喜,若是到最后发现数据质量不佳,那所有工作从头来过?

面对这些痛点,其实可以通过数据可视化组件来解决这些问题,减免“炼丹”前复杂的“生火”动作,完美跳过下载步骤,无需另写代码。


通过工具提升效率,带大家了解数据工程师生存必备工具之:


格物钛数据可视化组件

格物钛可视化组件,是基于格物钛标准格式开发的针对图片、点云、多传感器融合、语音以及文本类数据的快速在线可视化组件,支持原数据及其标注信息的同时可视化,支持多种分布方式查看数据特征,帮助算法工程师快速确认数据质量,将更多的精力投入AI开发的后续工作中!


可视化组件提供什么?

 直观预览原数据

在线预览主流格式的图片、点云、文本、音视频原数据,包括多种激光雷达点云图像的可视化。


01

图片类型

02

点云类型

03

语音类型

04

文本类型


滑动查看更多


 灵活查看标注信息

数据标注信息在线可视化,快速查看标注数据的标签、属性等信息。

快速选择文件,查看标注信息


通过分享功能,快速分享插件地址或将插件嵌入您自己的网页中。

分享插件地址、将插件嵌入自己的网页


 分布可视化洞察数据特征

列表、柱状图、饼图等多种样式查看数据的多级标注与属性分布,在线查看、实时统计数据,快速评估数据集质量以及对您使用场景的匹配程度!


01

饼图

02

柱状图

03

列表


滑动查看更多


如何快速使用可视化组件?

 可视化查看公开数据集

在格物钛公开数据集平台Graviti Open Datasets,我们提供了海量的公开数据集。


在查找数据集的过程中,您可点击进入数据集详情概要页面快速预览数据。


快速可视化查看数据集,掌握细节,所见即所得;试错成本大幅降低,轻松确定数据集为自己想要的Mr. Right。


 可视化自有数据集

您可将数据集上传至您在格物钛的个人空间,无需开发即可进行可视化。您可通过开发者工具上传融合数据集、连续数据以及标注数据,3D和多传感器等复杂场景都可以轻松搞定。


您无需针对每一种标注类型重新编写可视化代码,大大减少了可视化开发工作量。


 本地数据集可视化

如果您不想上传数据集,我们也提供本地可视化能力。


通过Python SDK读取本地数据,您可立即通过可视化组件浏览数据集,无需登陆和上传即可使用数据可视化插件所有功能,快速把握数据质量。


详情请查看:https://tensorbay-python-sdk.graviti.com/en/stable/features/visualization.html#pharos-usage


关于「格物钛」

格物钛定位为面向机器学习的数据平台,帮助AI开发者解决日益增长的非结构化数据难题。借助非结构化数据管理平台TensorBay和开源数据集社区Open Datasets,机器学习团队和个人可进行数据管理、查询、协同、可视化和版本控制等高效操作,降低高质量数据获取、存储和处理成本,加速AI开发和产品创新。


Open Datasets  👉

格物钛|公开数据集

graviti.cn/open-datasets




点击阅读原文 / 通过公开数据集查看可视化效果

浏览 33
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报