基于Flink SQL构建流批一体实时数仓
两个前置知识
五个基本概念
两个具体实现
两种架构对比
一个综合实操
流处理VS批处理


五个基本概念






维表JOIN与双流JOIN




两种架构对比



传统数仓
问题
1.两条计算链路、造成重复工作、计算资源浪费
2.两套数据模型,一致性难以保障

实时数仓
统一了基础公共数据
保障了流批结果的一致性
提升了离线数仓的时效性
减少了组件和链路的维护成本

一个综合实操



PDF资料获取方式: 关注公众号公众号,转发朋友圈并截图,后台回复: 666
推荐阅读:
评论
下载APP两个前置知识
五个基本概念
两个具体实现
两种架构对比
一个综合实操















问题
1.两条计算链路、造成重复工作、计算资源浪费
2.两套数据模型,一致性难以保障

统一了基础公共数据
保障了流批结果的一致性
提升了离线数仓的时效性
减少了组件和链路的维护成本




PDF资料获取方式: 关注公众号公众号,转发朋友圈并截图,后台回复: 666
推荐阅读: