最近大家最关心的事情是什么?那肯定是疫情了,不能出门的感觉真的很难受有没有?
我的内心和该腾讯员工一样:
为什么会变成这个样子阿!不吃野味会死吗?(此处省略无数字....)
可是生活还是要继续,我们能做的就是不添乱,自我防护。
为了让大家能更了解疫情,我在这里用数据可视化分析出了全国的疫情情况。
根据国家卫健委所公布的数据,我们可以看到重灾区依然是整个湖北省,浙江广东因为人流量较大的原因,也已经变成了重点区域。
一、数据哪里来?
网站的数据是定时更新的,可能上午看到的数据,下午就会更新,而且差异很大。而通过Excel进行数据汇总时,效率不高,很难做到完全同步。
因此我在考虑,利用Python进行抓包,并封装成为.exe文件,点击就可以自动下载数据,并以csv格式,进行结构化的存储,方便大家的各种使用。
这个工具每运行一次,就会从“腾讯新闻”疫情实时播报网站上,抓取并更新一次数据,并存储到你的电脑D盘(C盘往往需要更高权限读写)。
下载完成的csv文件格式如下:
其实,这个数据无论对企业、个人,还是对我们了解疫情变化发展趋势,都是非常实用。而且我看到网上有很多人,会从不同维度分析问题,作为基础数据也将很有帮助。
二、拿什么分析?
上面说了,拿Excel之类的工具进行数据分析最大的坏处就是数据不能同步,得需要手动录入,而且熟悉数据行业的人应该都知道,Excel遇到大数据就会卡死。
其实,分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了。
Python和Matplotlib都能进行可视化的分析,但是需要一定的代码基础,不会代码的人还是占了大多数。于是我想到了BI,即商业智能。
在这里,我用的是FineBI,一款企业级的数据分析工具,具有丰富的可视化和前端分析操作,能可视化地进行数据钻取,数据切片和数据旋转等多维分析操作;同时内置ETL,实时数据分析,同时对大数据能够做到飞速处理,业务人员分析数据再也不用等IT!
FineBI做的数据可视化:
三、数据可视化
有了数据,又有了数据分析工具FineBI,接下来就是成果展示了,有了数据直接拖拽就可以生成可视化,10分钟即可搞定~
1、全国动态热力图
关于此次疫情的整体情况大家都应该很清楚了,这里就不放数据了,给大家放一个从开始到现在各地区的疫情变化地图吧,该图片来自于某微博网友~
2、各城市感染气泡图
X轴为前后两天数据对比(两天时间各地区确诊增长速度),Y轴为100万人确诊率,气泡大小为当日确诊人数。
- 一象限(右上角):百万人确诊比率和增长率都大于平均值,是比较严重的地区,如图上的重庆
- 二象限(左上角):百万人确诊率大于平均值,增长率小于平均值,说明相对其他省形式有缓解,如浙江
- 三象限(左下角):两个指标都低于平均值,属于相对其他地区算比较正常,如广西
- 四象限(右下):增速快,确诊率低于平均值,属于需要提高警惕注意的地区,如江西
从气泡图中可以看出,浙江广东河南安徽这些省,已经变成了除湖北之外的第二重灾区,疫情已经到了刻不容缓的地步。
四、总结
疫情到现在也这么久了,中间也发生了很多让人惋惜和愤怒的事情,但是归根到底,绝大多数人的初衷就是结束这场没有硝烟的战争。
我们普通群众能做的就是安心在家,做好自身防护,相信国家能带领我们取得胜利,就像03年的那个事情一样。
关注我,并转发该文章,私信回复“BI”,即可获得FineBI个人永久免费版~
转载:https://blog.csdn.net/yuanziok/article/details/104167163