数据特征分析

数据科学与人工智能

共 4149字,需浏览 9分钟

 · 2020-08-12

    完成对数据的质量分析后,剩下的数据就可以绘制表图 计算了某些特征量等手段进行数据的特征分析。

分布分析 
揭示数据的分布特征和分布类型

  1. 定量数据:分析分布是对称,发现某些特征值的大小和可疑值,频率分布表、频率分布直方图、茎叶图

  2. 定性数据:饼图、条形图

1.定量分析数据 
原则:

  • 各组之间相互排斥

  • 所有数据必须包含

  • 组宽最好相等 

步骤
  1. 求极差

  2. 决定组数与组距

  3. 决定分点

  4. 列出频率分布表

  5. 绘制频率分布直方图

定量分析实例

c   销量
2015/3/1 51
2015/2/28 2618.2
2015/2/27 2608.4
2015/2/26 2651.9
2015/2/25 3442.1
2015/2/24 3393.1
2015/2/23 3136.6
2015/2/22 3744.1
2015/2/21 6607.4
2015/2/20 4060.3
2015/2/19 3614.7
2015/2/18 3295.5
2015/2/16 2332.1
2015/2/15 2699.3
2015/2/14
2015/2/13 3036.8
2015/2/12 865
2015/2/11 3014.3
2015/2/10 2742.8
2015/2/9 2173.5
2015/2/8 3161.8
2015/2/7 3023.8
2015/2/6 2998.1
2015/2/5 2805.9
2015/2/4 2383.4
2015/2/3 2620.2
2015/2/2 2600
2015/2/1 2358.6
2015/1/31 2682.2
2015/1/30 2766.8
2015/1/29 2618.8
2015/1/28 2714.3
2015/1/27 2280.8
2015/1/26 2414
2015/1/25 3130.6
2015/1/24 2716.9
2015/1/23 2930.8
2015/1/22 2504.9
2015/1/21 2559.5
2015/1/20 2168.6
2015/1/19 2436.4
2015/1/18 3234.3
2015/1/17 3061
2015/1/16 2900.1
2015/1/15 2646.8
2015/1/14 2615.2
2015/1/13 2124.4
2015/1/12 1958
2015/1/8 2259.1
2015/1/7 2419.8
2015/1/6 2775
2015/1/5 2594.9
2015/1/4 2468.3
2015/1/3 3004.3
2015/1/2 3313.3
2015/1/1 3613.6
2014/12/31 2655.9
2014/12/30 2644.3
2014/12/29 2565.3
2014/12/27 2525.9
2014/12/26 2778
2014/12/25 2542.1
2014/12/24 2473.3
2014/12/23 2240.1
2014/12/22 2575
2014/12/21 3802.8
2014/12/18 2274.7
2014/12/17 2687.2
2014/12/16 2577.8
2014/12/15 2583
2014/12/14 3282.6
2014/12/13 3113.7
2014/12/12 2661.4
2014/12/11 2553.2
2014/12/10 2511.3
2014/12/9 2710.3
2014/12/8 2468.1
2014/12/7 3041.5
2014/12/6 3178.9
2014/12/5 2594.4
2014/12/4 2381.1
2014/12/3 2415
2014/12/2 2236.4
2014/11/30 3207.2
2014/11/29 3059.5
2014/11/28 3039.1
2014/11/26 2817.5
2014/11/25 2891.8
2014/11/24 2470.1
2014/11/23 3556.6
2014/11/22 3397.7
2014/11/20 2761.6
2014/11/19 2618.2
2014/11/18 2758.3
2014/11/17 2614.3
2014/11/16 3437.1
2014/11/15 3250
2014/11/14 3063.7
2014/11/13 2839.2
2014/11/12 2360.9
2014/11/11 2158.5
2014/11/10 2005.5
2014/11/9 3236.4
2014/11/8 22
2014/11/7 2452.6
2014/11/6 2265
2014/11/5 2566.1
2014/11/4 2527.2
2014/11/3 2326.5
2014/11/2 2941.9
2014/11/1 60
2014/10/31 2520.9
2014/10/30 2446.2
2014/10/29 2549.4
2014/10/28 2449.3
2014/10/27 2162.5
2014/10/26 2781.3
2014/10/25 3060.6
2014/10/24 2064
2014/10/22 2439.7
2014/10/21 2476.2
2014/10/20 2478.3
2014/10/19 2826.2
2014/10/18 2924.8
2014/10/17 2417.5
2014/10/16 2450.1
2014/10/15 2533
2014/10/14 2238.7
2014/10/13 2388.8
2014/10/12 3291.3
2014/10/11 2738.8
2014/10/10 2344.1
2014/10/9 2068.8
2014/10/8 3185.3
2014/10/7 2778.6
2014/10/6 2921.1
2014/10/5 2524.3
2014/10/4 3057.1
2014/10/3 3039.6
2014/10/2 3193.4
2014/10/1 3075.4
2014/9/30 2847.6
2014/9/29 2311.4
2014/9/28 2327.3
2014/9/27 9106.44
2014/9/26 2616.6
2014/9/25 2620.2
2014/9/24 2616.4
2014/9/23 2655.8
2014/9/22 2310.7
2014/9/21 2935.8
2014/9/20 3017.9
2014/9/19 2625.5
2014/9/18 2752.7
2014/9/17 2181.5
2014/9/16 2440.5
2014/9/15 2422.8
2014/9/14 2583.6
2014/9/13 2728.9
2014/9/12 2525.3
2014/9/11 2531.7
2014/9/10 2300.5
2014/9/9 2097.5
2014/9/8 4065.2
2014/9/7 3555.2
2014/9/6 3462.5
2014/9/5 3033.1
2014/9/4 2926.1
2014/9/3 2431.4
2014/9/2 2706
2014/9/1 3049.9
2014/8/31 3494.7
2014/8/30 3691.9
2014/8/29 2929.5
2014/8/28 2760.6
2014/8/27 2593.7
2014/8/26 2884.4
2014/8/25 2591.3
2014/8/24 3022.6
2014/8/23 3052.1
2014/8/22 2789.2
2014/8/21 2909.8
2014/8/20 2326.8
2014/8/19 2453.1
2014/8/18 2351.2
2014/8/17 3279.1
2014/8/16 3381.9
2014/8/15 2988.1
2014/8/14 2577.7
2014/8/13 2332.3
2014/8/12 2518.6
2014/8/11 2697.5
2014/8/10 3244.7
2014/8/9 3346.7
2014/8/8 2900.6
2014/8/7 2759.1
2014/8/6 2915.8
2014/8/5 2618.1
2014/8/4 2993
2014/8/3 3436.4
2014/8/2 2261.7

第一步:求极差

极差=3960-45=3915

第二步:分组

#根据业务逻辑的含义,分组距为500
组数=极差/组距=3915/500=7.83~8

第三步:决定分点

[0,500)[500,1000)[1000,1500)[1500,2000)......[3500,4000)

第四步:绘制频率分表

用excle即可完成,

第五步:绘制频率分布直方图

《数据科学与人工智能》公众号推荐朋友们学习和使用Python语言,需要加入Python语言群的,请扫码加我个人微信,备注【姓名-Python群】,我诚邀你入群,大家学习和分享。



浏览 3
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报