我分析了方方的微博

我是因为一本没看过的日记知道的方方,我发誓在这之前我真不知道这个人。但是在过去的一段时间,她的名字持续出现在我的微博、B站以及朋友圈,很多朋友在议论她,我对这件事的认知是:方方首先做了一件“惊天动地的大事儿”,随后社交媒体抓住了这个热点,把方方送到了你眼前,在自媒体泛滥的今天,即使你不感兴趣,媒体也总能让你逃不开、躲不掉。

我本身对所谓的“和尚派”就很抵触,这是一群上了年纪的喜欢在别墅养花、写日记、批判社会不公平的人,但是同时他们也是占据社会资源相对较多的一群人,有知识、有地位、有资本。对,的确很讽刺,得到的最多的人,同时也是牢骚最多的人。

好了,上纲上线的事情我就不多说了,是左还是右相信人民大众和历史会有一个定论。接下来,我将对方方的微博从数量变化、粉丝交互、内容等方面做了一个简短的分析,让我感触颇深的地方在于,方方的出名印证了郭德纲相声里的一句话“要出名,先出事儿”,“惹出大事儿”后,关注度自然就来了,微博就是这样。

微博数量变化我分析了方方的微博

图1 方方年微博数量的变化

方方从2010年注册的微博,十年弹指一挥间,到目前为止方方总共发布了6531条微博,但2010年和2011年两年总共发布了不到10条微博,所以就在图中略去了,这十年平均每天发表2.15条微博。

我分析了方方的微博

我们先从看图1——方方年微博数量变化趋势图,可以看出方方这些年整体上发布微博的数量是下降的,刚刚注册的微博2012年平均每天发布4.4条微博。我们大胆推测,这应该是起床发一条、中午一条、晚饭一条,最后睡前一条,一日四更,比较可怕!到了2018年(1.27条/天)、2019年(0.68条/天)差不多每天一条;进入2020年,方方发布微博的频率又略有增加,达到1.72条/天。看这更新频率,真不愧是写日记的。

不过2020年只过去4个月,这样比较好像不太公平,于是我又比较了每年第一季度的微博数量,如图2所示,不过看起来情况变化不大。

我分析了方方的微博

图3: 方方周微博数量的变化

我们继续分析,看看每周以及每天的发布规律,根据我之前分析微博数据的经验,多数人每周、每天发布微博的情况还是挺有规律的,能够看出一个人的工作和作息的规律,那我们看看方方的情况怎么样。看起来周六发布的总体要高于其他时间,但还是不如之前我分析的明显。

再看看一天中的情况吧,看来她的主要战线是下午和晚上,尤其是下午1点左右和晚上11点左右有一个较为明显的高峰,猜测应该是刚刚吃过饭会习惯性的刷一下微博。另外观察到晚上最晚的微博更新时间也就到凌晨2点左右,作息还蛮规律的!

我分析了方方的微博

图4: 方方日微博数量的变化

粉丝互动情况

以上是从数量和时间的角度对进行的分析,下面我们看看方方的粉丝情况。根据我的统计,截止到4月15日,方方的粉丝数有4478071个,好家伙!四百万粉丝。另外,和粉丝数量最相关互动的就是微博的评论、点赞和转发了,我们来看一下这些年方方总共获得了多少点赞、评论和转发。

初步统计显示,在这十年间,她获得了85万评论,1510万点赞和近75万转发,不得不说方方的微博关注度还是蛮高的。

我分析了方方的微博

图5: 评论和转发数量随时间的变化趋势

我分析了方方的微博

图6: 点赞数量随时间变化趋势

我还比较关注的是,这些年她的微博的评论、点赞和转发的变化趋势是怎样的,我感觉最近一段时间应该会暴增吧,我们来看看统计结果。结果在图5和图6,不看不知道,一看吓一跳,好家伙,这点赞、评论和转发从2019年开始真的是直线上升!

我分析了方方的微博

图7: 2019至2020微博数量与评论数量占比

我分析了方方的微博

图8: 2019至2020 微博点赞、转发占比

经过简单计算我又发现了,2019年至2020年一年多的时间,方方总共更新了430条微博,仅占总微博数7%不到(图7左),但是却收获其总评论量的83%(图7右),总点赞数量的99%(图8左),总转发数量的60%(图8右)。这,写了本日记,真是想不火都不行!

发布设备分析

微博是可以选择显示发布状态的设备的,我们再看看方方的发布微博的设备,这里我也是按出现频率来排序的,可以看到方方网页端使用次数是最多的,其次是苹果的产品,5S,6S,XS,iPad,iPad mini都有,还是个果粉。

微博 weibo.com    2990iPhone 6s        978iPad客户端        803iPhone客户端      792360安全浏览器      615iPhone 5s        131iPhone XS         68iOS               52新浪博客           20微访谈             16iPad mini         13

微博内容分析

接下来我们看看方方近期发布的微博,内容方面又有哪些特征。我首先使用jieba分词工具对微博内容进行分词以及去停用词,需要注意的是,微博里面一些敏感词已经被我删去了,下面是方方微博中去掉停用词、敏感词之后的高频词汇。

[('武汉', 394), ('疫情', 208), ('医生', 204), ('医院', 177), ('朋友', 172),('病人', 97), ('方方', 91), ('感染', 91), ('湖北', 89), ('日记', 79), ('文章', 65), ('政府', 65), ('信息', 64), ('视频', 62), ('病毒', 61), ('隔离', 60), ('新冠', 54), ('微博', 54), ('肺炎', 51), ('新增', 51), ('中国', 51), ('记者', 49), ('封城', 49), ('确诊', 48), ('治疗', 48), ('生活', 46), ('国家', 46), ('控制', 40), ('希望', 40), ('医护人员', 40), ('教授', 38), ('中心医院', 38), ('社会', 37), ('消息', 36), ('极左', 36)]

可以看出,整体上是围绕“疫情”,“医院”,“政府”等词汇来的,基本可以认为是围绕疫情的一些话题,也出现了如“极左”等政敏感词汇。不过我最近看了最近的一些新闻,看到有国外媒体把方方称为战地记者,真是可笑至极,没见过在别墅里面写日记的战地记者。

我分析了方方的微博

最后,我们给方方的微博做个词云吧,其实我用主题模型也做了分析,感觉没有可视化的词云效果好,结果基本和高频词差的不多。

总结:疫情是一次很好的考试,平时相安无事,危难的时候各路妖魔鬼怪就都显露出来了,有“跑到国外道歉的”,“有抹黑的”,但这些人终究是少数。时间越久,好人越多、正能量越足,劣币自然也就没有生存空间,即使有,也不过是些跳梁小丑而已。

欢迎喜欢关注时事政治的朋友关注我,与我讨论,需要方方微博数据以及我的分析代码,可以留意下方评论。

未经允许不得转载:其他 » 我分析了方方的微博