一个案例教会你:如何对产品做数据分析?
点击关注"Python学习与数据挖掘"
更多超级干货第一时间推送给你哦!!!
本文来自:知乎
下面我们就可以开始进行数据分析了!
希望可以通过对数据中的信息进行挖掘,找出需要进行改善的地方,针对性的采取措施,从而提高最后的产品销量。
销量随时间变化的规律是怎样的?
婴儿年龄对产品销量的影响?
婴儿性别对产品销量的影响?
这里要分析销量的各种关系,所以先对销量数据进行数据清洗:
从购买数据可以发现,平均购买量为2.5,这里最大购买数量居然达到了10000,所以购买数据中存在异常数据,这里的处理方法是将超过平均值3倍标准差的异常数据进行剔除,平均值为2.5,标准差为63,剔除购买数量大于191.5的数据。
这里将购买数量大于2的用户筛选出来,这里统计出共52位用户,占总用户数的52/29971=0.0017,占比较少,所以不再分析,着重分析新用户购买量。
结论1:老用户占比较小,所以对销量的影响较小,老用户购买量下降导致2015年销量下降的假设不成立。
这里通过对数据处理可以发现,2015年的数据只有1,2月的数据,这可能就是数据的不完整导致了2015年的购买数量出现了大幅的下降。
我们进一步的对每一年的1,2月份的购买数量进行对比,进一步发掘2015年的1,2月的购买数量是否真的出现了下降。
接着我们再做出假设,可能是因为双十一及其他活动造成单月销量增加,然后我们要去搜集证据验证这个理论:
从图中可以发现11月中11号的销售数据出现了较高值,所以可能是双11促销活动提升了产品销量。
那有没有可能还是别的原因造成第四季度上升的呢,我们再做出假设三:可能是因为爆款产品的出现拉动了四季度产品的销售数据。
通过对不同产品的销量数据进行统计可以发现,500118831销量占比最高,所以下面从这这个产品的销量数据入手进行分析。
从图中可以发现500118831在11月份的销量出现了遥遥领先的数据,购买量急剧的提高。
假设2:男童数量大于女童
结论2:从性别分布图中可以发现,男女比例基本相同,所以假设2不成立。
假设3:年龄对购买量有影响,且男童的年龄分布与女童不同
(2)男童与女童的年龄分布
从图中可以发现,男童以及女童的年龄分布是类似的,也就是0-1岁分布的最为聚集,综合上述的分析可以得出
3、婴儿年龄与产品销量的关系
2015年的销量出现了异常是因为源数据的不完整所导致。
四季度是婴儿产品销量的高峰期,其主要原因是双十一等促销活动的开展对产品销量的促进,同时爆款产品的出现也对销量的提升有很大的帮助。
婴儿性别与商品销量的关系主要是几笔较大的购买造成,与婴儿本身性别关系无关。
电商的商品主要面对低龄儿童,因此随着婴儿年龄的增长,商品的销量出现了下降。
建议在商品销量较低的月份采用促销的方式来促进淡季的销售数据。
调整产品范围,缩减适用于5岁后孩子的产品,集中供应0-1岁的婴幼儿产品。尤其是要丰富1岁前孩子适用的婴幼儿产品,特别是男童,给顾客创造更多消费的机会。
针对不同的客户采取不同的营销策略,例如对一些购买量较大,购买频率较低的顾客要多加交流和联系,提高购买次数。
另外,再送大家一份《Python数据科学手册》
以大数据、云计算、物联网、人工智能等新技术所推动的数字化转型正迅速的改变着我们所处的时代,各大互联网公司都积累了大量的用户数据,比如购物、社交、出行等。充分挖掘数据价值,就是需要不断的和数据打交道。
如果你对数据分析、数据挖掘、数据化运营感兴趣,却又无从下手,那么我来给你推荐一本不错的书籍--《Python数据科学手册》。
领取方式:
长按扫码,发消息 [数据分析]