我国的离婚率现状,通过数据的可视化展示,来直观的展现给大家[Python基础]
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
Python 数据分析练习讲解:数据可视化
https://www.bilibili.com/video/BV1sK4y1E77C/
前言
2020年的最后一段时间里,大家都在期盼着新一年到来的日子里,又有一位重量级的女明星宣布结束了自己的婚姻。12月23日中午,周迅和高圣远在微博中向大家宣布了自己的离婚的消息,一时间成为了微博的沸点话题。大家为他们感到惋惜的同时,也祝福两人以后都能够各自安好,拥有自己美好的人生。
其实离婚的话题,在我们的日常生活中,已经不算是非常新鲜的话题了,根据民政部门的大数据显示,我国的离婚率已经连续8年升高,而结婚率已经连续5年下降。为了更好的帮助大家了解目前我国的离婚率现状,我们通过数据的可视化展示,来直观的展现给大家。
1
数据获取
对于数据的获取,可以直接到国家统计局的官方网站进行获取,网址为:
https://data.stats.gov.cn/easyquery.htm?cn=C01&zb=A0P0C&sj=2019
由于国家统计局的数据都是面向公众开放的,因此我们不必利用爬虫程序进行爬取,可以直接从网站上进行下载,如下图所示:
这里下载的数据是针对于全国的情况进行统计的,我们还可以分省年度报名中,下载每个省市的离婚信息的年度报表。
2
数据分析
1).数据的初步分析
获取到数据之后,我们先来对全国的离婚信息进行了解。
从上面的信息可以看到统计的信息中包含了结婚登记、内地居民登记结婚、离婚登记等等信息的统计。而这里的粗离婚率指的是年度离婚数与总人口之比。对应到我们上图的数据中,以2019年为例,粗离婚率是千分之3.36,也就是说在1000个人当中有3.36人会离婚。
2).数据可视化
俗话说“字不如表,表不如图”,我们接着利用图表来看一下,近十年来我国的粗离婚率的变化情况。
我们将全国数据中的年份信息和粗离婚率的信息提取出来,并命名为x_data和y_data,然后利用pyecharts中的Line类来绘制可视化结果,结果如下:
可以看到,我国的粗离婚率随着时间的发展而不断的攀升,从2010年到2019年这十年间,粗离婚率翻了近1.7倍。
3).离婚率的统计
从全国的数据中,可以看到,2019年,我国的粗离婚率的平均数值为3.36。我们来统计一下,全国31个省市自治区中,位于平均数值的省市数量的分布情况。
程序首先提取了各个省市自治区数据中,2019年粗离婚率数据,然后根据均值的大小来进行判断统计,最后利用Pie类来进行可视化的展示。
从可视化的统计结果来看,我们可以得到以下几点结论。大于3.36的省市数量和小于3.36的省市数量几乎是旗鼓相当,没有一个城市的粗离婚率恰好等于3.36,并且粗离婚率大于3.36的城市为16个。所以说全国范围内离婚率都处在一个较为平衡的范围内,并没有哪一个省市的离婚率较为突出。
04).北京 VS 上海 离婚率
虽然北京上海在离婚率上不是很突出,但是我们还是可以来针对这两个城市来做一个针对性的对比,利用Altair库来看一下,北京和上海近十年的离婚率对比情况。
程序首先读取北京市和上海市的粗离婚率数据,然后提取并构造年份、城市等数据,并整合为DataFrame格式的数据,然后通过Altair库来构造可视化柱状图,运行上述程序,得到以下的结果。
可以看出,北京和上海的离婚率从各自的城市出发,呈现规律性的波动,总是连续几年增长后迅速回落,然后再次慢慢增长,而且有趣的是,两个城市的波动规律几乎是完全相同的。而从两个城市对比的角度来看,北京的粗离婚率总是高于上海。
以上是 我国的离婚率现状,通过数据的可视化展示,来直观的展现给大家[Python基础] 的全部内容, 来源链接: utcz.com/z/530627.html