基于Flink SQL构建流批一体实时数仓
两个前置知识
五个基本概念
两个具体实现
两种架构对比
一个综合实操
流处理VS批处理
五个基本概念
维表JOIN与双流JOIN
两种架构对比
传统数仓
问题
1.两条计算链路、造成重复工作、计算资源浪费
2.两套数据模型,一致性难以保障
实时数仓
统一了基础公共数据
保障了流批结果的一致性
提升了离线数仓的时效性
减少了组件和链路的维护成本
一个综合实操
PDF资料获取方式: 关注公众号公众号,转发朋友圈并截图,后台回复: 666
推荐阅读:
评论