15年“老码农”的经(惊)验(艳)分享
2018年,我的第一本书《码农翻身》出版。 2021年,第二本书《半小时漫画计算机》出版。 2024年,第三本书《码农翻身2》终于出版了。 平均三年出一本书,这么保持下去,等我退休的时候,岂不是... 打住吧,这三本书,...
proginn1433465165
0
什么是数据湖,什么是湖仓一体呢?
关注我???,持续学习 大概从2021年数据湖这个概念开始火了起来,我们今天来聊聊为什么需要用数据湖。 转山转水转佛塔 只为途中与你相见班公湖 16年骑行新藏阿里北线 摄 前言 首先思考几个问题 班公湖里的水是怎么来...
proginn1433465165
0
实践场景:解决Spark流处理产生的小文件
背景 做流批一体,湖仓一体的大数据架构,常见的做法就是: 数据源->spark Streaming->ODS(数据湖)->spark streaming->DWD(数据湖)->... 那么数据源->spark Streaming->ODS,以这段为例,...
proginn1433465165
0
Python 或 大数据学习的来(个人技术群招人了)
Python相关 Python基础 爬虫 数据分析AI 点击关注 目前0-1个人学习的大纲 现邀请有python共同学习的战友一起从0-1学习 【注意】:Python群没有大神,基本上都是0-1学习者 大数据相关 大数据群,从2021开始到现在,聚...
proginn1433465165
0
新的一年工作:苟着,活着
新的一年,继续一起学习,关注我??? 跳槽分享者xxx,化名:跳跳,跳槽的“跳”。上市企业高级大数据开发工程师,月薪20+吧。 跳跳在上家公司有三年吧,感觉到身心力乏,工作一段时间的跳跳,虽然在互联网大环境残酷的...
proginn1433465165
0
数据质量的坑,该怎么填?
00 前言 数据质量人人有责,这不仅仅只是一句口号,更是数据工作者的生命线。数据质量的好坏直接决定着数据价值高低。 数据质量管理是指在数据创建、加工、使用和迁移等过程中,通过开展数据质量定义、过程控制、监...
proginn1433465165
0