什么是标签?跟数据中台有什么关系?终于有人讲明白了

机器学习算法与Python实战

共 3342字,需浏览 7分钟

 ·

2021-06-18 10:57

作者:任寅姿 季乐乐   来源:大数据DT(ID:hzdashuju)



01 什么是标签

标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。

从粒度上来讲,标签往往映射为某一对象的属性,包括固有属性和动态属性,一般都需要结构化到字段粒度,保障可被后续数据服务便捷使用。它面向数据应用的业务端,核心解答的是数据怎么用、资产价值在哪里的问题。根据加工方式的不同,标签可以分成基础类标签、统计类标签和算法类标签。


02 什么是数据中台

伴随着云计算、大数据、人工智能等技术的快速发展,企业数字化、智能化转型步伐逐渐加快。

数据中台是2018年逐渐兴起的数据概念,核心要义在于增援未来,以发展的眼光解决企业未来可能面临的各种场景问题。面对不确定的未来,企业需要组织沉淀可复用的标签资产,加强数据服务能力,构建出自己的数据中台,才能符合数字化转型的时代要求。

定义角度看,数据中台是一套可持续“让企业数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。

架构角度看,数据中台上承业务数据积累,通过自己的数据平台工具,将原始数据加工成数据资产,并通过数据资产服务化下启数据应用场景,帮助业务端或管理端降本增效。数据中台不只是一套生产加工的流程,它对企业的战略定位、组织保障、基础设施等方面都产生了深远的影响,如图2-14所示。

▲图2-14 数据中台架构图

实施角度看,数据中台是以数据资产为核心,以实现数据资产可见、可懂、可用、可运营的系列目标为出发点,配以平台工具、流程规范、应用建设等必要环节,最终落地的数据解决方案,如图2-15所示。

▲图2-15 以数据资产为核心的实施配套


03 标签在其中的重要位置

将企业的完整技术架构图抽丝剥茧,可以看到“标签”在数据中台中的具体位置:数据中台位于云底座与上层业务应用之间,即位于稳定厚重的技术大后台与灵活多变的业务小前台之间。通过数据中台对底层复杂技术能力的抽象封装,前端业务可以自由、轻便地使用数据能力,弥合前后端步伐不一致的问题。

在数据中台内部,具体又细分出开发工具层、数据资产层、资产管理层、数据服务层、数据运营体系、数据安全体系等模块,如图2-16所示。

▲图2-16 标签在数据中台中的位置

原始汇入的数据通过开发工具层转变为企业自有的数据资产;在资产管理层对数据资产进行不断的治理优化;最终通过资产服务化将数据资产输送到业务各端,实现数据价值;统一的运营体系和标准安全管理主要从流程机制层面保障整个数据中台的平稳有序运行。

在数据中台中,开发或管理工具是可以直接采购的,运营体系和标准安全规范的方法论是可以学习的,但是数据资产和数据服务必须是企业自行建设和实施的结果,它们是数据中台的核心部分,没有捷径可走。

数据资产和数据服务中最核心的是标签:数据资产本身以标签为组织载体,而数据服务本质上是一种将标签传递给业务端使用的价值管道。标签是数据中台价值链路中“核心的核心”。

关于作者:任寅姿(花名:影姿),资深产品总监、数澜研究院院长拥有超过10年的数据产品经验,原阿里巴巴集团数据产品专家,曾负责集团消费者标签类目体系、DMP精准营销等系统的数据资产设计与实施。2016年加入数澜科技,负责管理公司产品团队,系统提升团队数据思维、数据资产设计能力及数据服务应用经验,是数据中台理论定义及体系构建的核心参与者。
季乐乐(花名:寒泉),政法行业资深专家、产品专家拥有超过6年的政法行业产品经验,原南京通达海区域负责人,专注于研究数字检务、智慧法院等领域。

本文摘编自标签类目体系:面向业务的数据资产设计方法论》,经出版方授权发布。

延伸阅读标签类目体系
点击上图了解及购买
转载请联系微信:DoctorData

推荐语:标签类目体系是数据中台理念落地的核心组成部分,是实现数据资产可复用、柔性组合使用、降低数据应用试错门槛的强力支撑。本书旨在培养资深的数据资产架构师及数据运营专家,以方法教育而非工具实施的方式助力企业建立自身的数据资产化能力,将数据能力最大限度地转化为商业价值。
    
也可以加一下老胡的微信
围观朋友圈~~~


推荐阅读

(点击标题可跳转阅读)

深度学习的四个学习阶段!

2021年,机器学习研究风向要变了?

【机器学习】随机森林是我最喜欢的模型

Python之父:Python 4.0可能不会来了

【2021版】机器学习、深度学习调参手册

亚马逊首席科学家李沐博士:工作五年反思

【小抄】机器学习常见知识点总结(2021)

引用次数在15000次以上的都是什么神仙论文?

【下载】80页笔记看遍机器学习基本概念、算法、模型

老铁,三连支持一下,好吗?

浏览 14
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报