数据分析师技能树
每隔一段时间,都会整理下自己的技能树,看看有哪些可以再加上去,然后平时学习时,沿着技能树的内容查漏补缺。下面是最近整理的,觉得还有需要补充的同学可以留言说一下。
MySQL
基础查询语句:查询语句 select、表来源 from、条件语句 where、数据分组 group by、数据过滤 having、数据排序 order by、限制行数 limit; 多表查询语句:内连接(join/inner join)、左连接(left join) 、右连接(right join) ; 条件函数:case when、if; 聚合函数:求和 sum()、均值 avg()、计数 count()、最大值 max()、最小值 min(); 窗口函数: 累计计算窗口函数:sum()over(partition by ... order by ...)、avg()over(partition by ... order by ...); 分区排序窗口函数:row_number()over()、rank()over()、dense_rank()over(); 分组排序窗口函数:ntile()over(); 偏移分析窗口函数:lag()over()、lead()over(); SQL定义与操作语言:创建表 create 、插入语句 insert into 、更新语句 update 、删除语句 delete。
Python
NumPy、Pandas、matplotlib库; sklearn 库。
机器学习
算法模型:决策树、随机森林、回归模型、K-Means聚类、K近邻、贝叶斯、支持向量机、Apriori关联规则等; 特征工程:特征缩放/归一化,分类变量,数据降维,特征选择。
统计学
描述统计:频数分析、集中趋势、离散程度、数据分布; 参数估计:总体、个体、样本;点估计和区间估计;中心极限定理;正态分布; 假设检验:双边检验、单边检验;Z检验、t检验、卡方检验、F检验; 线性回归:一元线性回归、多元线性回归、损失函数; 时间序列分析:AR、MA、ARMA、ARIMA模型。
思维
认知:PEST、5W2H、SWOT、4P理论、用户行为理论,波士顿矩阵,二八原则; 数据:AARRR,用户增长。
Tableau
工作表、仪表盘和故事; 可视化:柱状图和条形图、折线图和面积图、饼图和环形图、散点图和气泡图、箱线图。
数学
线性代数 微积分 概率论
大数据
Java,Linux,Hadoop,Spark,Hive,ETL,Flink。
其他技能
SPSS、Excel;
评论