数据湖和数据中台是什么关系?终于有人讲明白了
大数据DT
共 5134字,需浏览 11分钟
·
2020-08-21 23:31
导读:本文聊一聊数据湖与当下热度非常高的数据中台之间的关系。
数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统,它按原样存储数据,而无需事先对数据进行结构化处理。一个数据湖可以存储结构化数据(如关系型数据库中的表),半结构化数据(如CSV、日志、XML、JSON),非结构化数据(如电子邮件、文档、PDF)和二进制数据(如图形、音频、视频)。
绝大部分企业的需求数据仓库基本都能满足了,只有少部分企业才能用到数据湖或大数据平台,好多企业都被忽悠上了大数据平台,光有个架子,却不知道能用来干嘛。对非结构化数据的处理,大多数企业本身除了数据存储之外,几乎不知道该怎么用。甚至大多数据企业连结构化数据都还处理不好,数据意识还停留在起步阶段。
数据中台是数据+技术+产品+组织的组合,是企业开展新型运营的一个中枢系统。具象的说,它是一套解决方案,抽象的理解,它是一种新的公司运营理念。
数据中台是让数据用起来持续的一套机制,经过业务数据化、数据资产化、资产服务化,并在有权限管理的情况下以 API 的方式开放出去 。
数据中台可以理解为企业的最核心的数据大脑……是一种理念,一种思维,是一种面向未来的架构。 袋鼠云将其总结为“5+1”模式,5是建设数据中台的五步法,即:咨询、规划、建设、应用、运营,1是是指一个大数据平台,提供大数据的处理、计算、分析、应用。
数据中台与业务中台的一体化,其核心作用便是业务中台天然打通、统一了各个渠道的数据,所有数据都是高质量的,而这些数据通过分析能够反哺到业务本身,业务本身又将数据留给数据平台,从而形成良好的正向反馈。
“数据中台是高质量、高效赋能数据前台的一系列数据系统和数据服务的组合”,无论是数据中台、业务总台、技术中台,核心都是“标准化”,实现流程都是先“规范化”,然后把规范“产品化工具化”。
数据中台是一个集数据采集、融合、治理、组织管理、智能分析为一体,持续促进业务创新为目标的整体平台。
数据湖是一个中心数据存储的容器,这个容器可以存储格式化、非格式化的各种各样的数据;这些数据非常容易被快速缩放、有各种方法和工具对这些数据进行查询、可以做各种各样的分析。
评论