Python 也可以分析公众号
共 1467字,需浏览 3分钟
·
2020-09-15 18:04
注:源码见文末获取
前言
不知不觉,小编写公众号已经一年多了,对自己的公众号的状况心中还是有点了解的。
这次呢小编从数据的角度,来看一看小编这一年多的运营状况到底如何。
由于小编多坚持原创,文章数不算太多,就没有写爬虫爬取数据了,而是手动录入数据。
数据两张表,文章信息表,转载状况表:
通过这两张表,进行探索性描述分析,再下钻分析,需求如下:
发表文章总数
查看文章标题用词状况
用户数增长走势
阅读数区间
看一看,点赞,赞赏金额分布
原创,转载,广告文章数的占比
文章类型占比
阅读数,看一看,点赞,赞赏,被转载数是否有相关性
.哪种类型文章阅读量高
推送到其他群聊对阅读数的影响
被转载的都有哪些,是什么类型的
被转载的阅读数与原文的阅读数对比
哪一个公众号转载次数最多,累计阅读量
对于本号,阅读数高的文章类型
木下学Python
运营一年多,总共发表了 64 篇文章,关注久的读者都知道小编发文频率一月大约两篇左右,所以总共才那么多文章:
那在这些文章中,原创,转载,广告的占比如何呢?关注久的读者都知道小编还是坚持原创的更多:
在这些文章中,小编文章标题用词情况是什么样呢?小编制作了一个文件形状的词云,发现 Python,爬虫,分析,数据的比较明多:
小编的用户数是怎么样呢,小编只是一个小小号主,没有装载很多,坚持原创,所以在前期增长比较慢,到了后面积累了一些有质量的文章后才增长快了一些:
阅读数可以反映总体阅读数分布,从一定程度上反映了阅读数越高,文章对大家来说感兴趣度比较高,小编把阅读数划分为了几个区间,大多分布在 150-450 之间:
不仅是阅读数,看一看,点赞数,赞赏金额也一定程度反映了读者对文章的感兴趣度,小编查看所有文章的分布看一看每篇大多在 5 个,点赞数 1-20 之间,赞赏大多分布在 0-6 元之间:
小编文章类别最多的是爬虫类,因为最初都是爬虫文章,其次是其他,包含了广告,工具,系统环境,推荐书籍,自我总结,文章汇总等:
阅读数,看一看,点赞,赞赏,被转载中相关性较强的是阅读数与看一看,阅读数越多,看一看的数可能也会随之增长:
那什么类型的文章阅读数多呢,小编是爬虫阅读数最高,再想想前期一直是写爬虫类,数据分析的后面才开始写,数量还不多,多以阅读量相对较少:
小编有时会分享到一些群聊,那是否分享对阅读数有影响吗?从结果上看,分享过的阅读数相对会高一些:
小编的文章有几篇还是有些质量的,得到了一些大佬的转载,最多的一篇被转载了 9 次:
再来看看被转载的原文阅读数,与大佬们转载后的阅读数相比,小号主始终是小号主啊:
转载的公众号都有这些,有些不止转载了一次,看来还是挺好的嘛:
阅读数较高的文章,小编的公众号阅读大于 400 就算高的啦,毕竟小号主嘛,这些文章中那种类型最多呢?最多的可以一定程度反映读者对这类文章的感兴趣度:
到此小编简要的分析了下运营状况,还想知道更多的可以试试噢,小编提供数据集与代码供大家参考。
源码获取
关注微信公众号 “木下学Python”,回复 “木下” 即可获取
END
读者交流群已建立,找到我备注 “交流”,即可获得加入我们~
听说点 “在看” 的都变得更好看呐~
关注关注小编呗~小编给你分享爬虫,数据分析,可视化的内容噢~
扫一扫下方二维码即可关注我噢~
-END-