【Python】统计科学之你能分清比例和比率吗?

统计科学之你能分清比例和比率吗?

张俊红发布于 今天 07:02

今天给大家分享两个概念,比例和比率。

前两天发过,发了以后有读者反映有点瑕疵,所以删除了重发。

比例和比率,乍一看上去,好像这两个指标没啥区别,都是用来表示比的,但实际上两者不止概念有些差别,应用场景也不太一样。

比例用来反映一个整体中各部分之间的组成情况,一般用 a :b 的形式表现,比如东南西北四个区的贷款数量之间的比例为:35:30:20:15,这四部分组成了全国这一个整体。

单身群体中,男女比例为1:2,这也是比例。

比率则用来反映组成总体的某一部分在总体中的一个占比情况,一般用百分比来表示。比如坏账率就是总贷款量中的坏账量在总贷款量中的一个占比。每个区域的坏账率就是每个区域内坏账量在这个区域内总贷款量的一个占比。东南西北四个区的坏账率分别为15%、20%、30%、35%。如下图所示:
【Python】统计科学之你能分清比例和比率吗?

坏账率 = 坏账量/总贷款量。

男生群体中有50%的人是单身,这也是比率。

现在总共有100笔坏账,其中东南西北四个区各自区域的坏账比例为:50:25:15:10。东区的坏账量在全国的坏账量里面比例是最高的,但是能说东区是全国坏账最严重的地方吗?显然不太能。我们还需要看一下这100笔坏账是来自于哪些贷款的,即每个分区的坏账是基于多少贷款量产生的,也就是看一下各自区域内的坏账比率,下图所示:
【Python】统计科学之你能分清比例和比率吗?

通过上图可以发现,虽然东区的坏账量在全国坏账量里面的比例是最高的,但是坏账率是全国四个区里面最低的,之所以坏账量占比高是因为总贷款量基数比较大。

其实坏账率和贷款量之间一直是一个博弈的过程,要想有更多的贷款量,就需要把审核门槛降低,可是降低审核门槛就意味着坏账率将会很大概率升高。

所以在日常分析过程中,首先要清楚分析的目的,然后根据实际情况使用比例或比率或两者结合同时使用,不能想当然的以比例或比率得出结论。

mysqlpython数据库网页爬虫深度学习

阅读 45发布于 今天 07:02

本作品系原创,采用《署名-非商业性使用-禁止演绎 4.0 国际》许可协议


俊红的数据分析之路

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

avatar

张俊红

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

1 声望

0 粉丝

0 条评论

得票时间

avatar

张俊红

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

1 声望

0 粉丝

宣传栏

今天给大家分享两个概念,比例和比率。

前两天发过,发了以后有读者反映有点瑕疵,所以删除了重发。

比例和比率,乍一看上去,好像这两个指标没啥区别,都是用来表示比的,但实际上两者不止概念有些差别,应用场景也不太一样。

比例用来反映一个整体中各部分之间的组成情况,一般用 a :b 的形式表现,比如东南西北四个区的贷款数量之间的比例为:35:30:20:15,这四部分组成了全国这一个整体。

单身群体中,男女比例为1:2,这也是比例。

比率则用来反映组成总体的某一部分在总体中的一个占比情况,一般用百分比来表示。比如坏账率就是总贷款量中的坏账量在总贷款量中的一个占比。每个区域的坏账率就是每个区域内坏账量在这个区域内总贷款量的一个占比。东南西北四个区的坏账率分别为15%、20%、30%、35%。如下图所示:
【Python】统计科学之你能分清比例和比率吗?

坏账率 = 坏账量/总贷款量。

男生群体中有50%的人是单身,这也是比率。

现在总共有100笔坏账,其中东南西北四个区各自区域的坏账比例为:50:25:15:10。东区的坏账量在全国的坏账量里面比例是最高的,但是能说东区是全国坏账最严重的地方吗?显然不太能。我们还需要看一下这100笔坏账是来自于哪些贷款的,即每个分区的坏账是基于多少贷款量产生的,也就是看一下各自区域内的坏账比率,下图所示:
【Python】统计科学之你能分清比例和比率吗?

通过上图可以发现,虽然东区的坏账量在全国坏账量里面的比例是最高的,但是坏账率是全国四个区里面最低的,之所以坏账量占比高是因为总贷款量基数比较大。

其实坏账率和贷款量之间一直是一个博弈的过程,要想有更多的贷款量,就需要把审核门槛降低,可是降低审核门槛就意味着坏账率将会很大概率升高。

所以在日常分析过程中,首先要清楚分析的目的,然后根据实际情况使用比例或比率或两者结合同时使用,不能想当然的以比例或比率得出结论。

以上是 【Python】统计科学之你能分清比例和比率吗? 的全部内容, 来源链接: utcz.com/a/109189.html

回到顶部