作者:Lemonbit
出品:Python数据之道
用 Python可视化神器 Plotly
动态演示全球疫情变化趋势
近期对疫情数据进行可视化的内容比较多,今天我来用 Python 可视化申请 Plotly 对国外的疫情发展情况进行可视化,以项目实战的形式,在分析和了解国外疫情变化趋势的同时,加深大家对 Plotly 的学习应用。
在开始之前,我们先来看看最终制作的部分效果图,如果你觉得有兴趣,不妨继续往下看。
数据来源
国内的疫情,目前已逐步受到控制,各项指标已开始明显好转,但国外的情况,看起来不是太乐观,已有的作业也没有抄好,所以,本次我们主要来可视化分析国外疫情的发展情况。
疫情的数据来源于开源项目 Akshare,由于使用该项目获取数据时,有时不太稳定,可能会遇到连接失败的情况,所以,这里我提供了保存好的数据供大家使用。
准备工作
-
Mac 系统
-
Anaconda(Python 3.7)
-
Jupyter Notebook
本次使用到的 Python 库包括 akshare, pandas, plotly 等,导入如下:
接着,我们读取已获得的数据,已保存的数据是截至3月7日的。
从上面获取的数据,有些数据格式需要加以调整,对于日期,我们这里会组织两列数据,一列是时间格式的日期( ['date']
),一列是字符串格式的日期 ( ['dates']
)。这样设置的原因,是因为我们后续分别需要用到这两种格式的日期。
获取国外的疫情数据
上面的数据,是全球的数据,我们可以把其中属于中国的剔除,就可以得到国外的数据了。
先来用 plotly express 看下国外疫情分国家的整体走势。
从上图可以看出,国外的疫情发展情况,大部分国家从2月10日期,发展趋势较为明显,因此,后面我们重点分析这段时间之后的情况。
由于部分国家的数据不是从2020年2月10日开始记录的,所以要补充数据。我们可以手动新建一个 excel数据表,将补充日期的数值填充为 0 。
我这里主要补充的是伊朗的数据,因为伊朗实在是发展太快了,必须纳入分析的范围内。其他国家,如果有需要补充的,后续可以继续完善。
将需要补充的数据弄好后,我们可以合并上面这两部分数据,一起进行分析。
得到合并的数据后,首先,我们用气泡图来对变化情况进行可视化,这里用的是 plotly express 的散点图。
plotly express 现在已经合并到 plotly 中,个人觉得跟 plotly 原生内容的协同性相对 cufflinks 要好用点。
从上面这个动态图可以清晰的看出,当前,在海外的国家中,韩国、伊朗、意大利三个国家最为严重。这三个国家中,就增长趋势而言,伊朗和意大利又比韩国要更明显,目前韩国的增长有所放缓,而伊朗和意大利还处于快速增长的过程中,后续情况不容乐观。
此外,在这个图中,另外还有几个国家值得关注,日本,除去钻石号之外,从数据来看,本土的增长目前还算是在稍微较好的范围内。反倒是,德国、法国、西班牙,个人觉得已成逐步壮大之势,不得不防。
而且,由于整个欧盟国家之间,人员是自由流通的,现在看来,整个欧盟很可能会成为疫情的重灾区,其影响巨大。
上图左下角的这些国家的走势,我们可以拉近来看,走势如下,这样,对于 德国、法国、西班牙就会看的更明显了。
这里,还有一个国家,就是美国,虽然从数据以及增长情况来看,好像美国还好,但恐怕实际情况,要糟糕很多。
上面是以气泡图的方式来演示变化过程,我们也可以以柱状图的形式来演示,效果如下:
需要说明的是,本文代码是在 Jupyter Notebook 中运行的, 如果是在 PyCharm 等 IDE 中运行,需要稍微修改下代码。
最后,再次感谢开源项目 Akshare 提供了数据接口。
近期热门:
火爆全网!这个 Python 项目很骚气!
你必须掌握的20个python代码,短小精悍,用处无穷
Python 最强编辑器详细使用指南!
点击阅读原文,阅读菜鸟学Python 400篇干货!
本篇文章来源于: 菜鸟学Python
内容反馈