series.corr() 方法在 pandas 中是如何工作的?

大熊猫。用于计算排除缺失值的两个系列对象之间相关性的方法。结果,它返回一个从-1到1变化的浮点值。如果输出是整数1,表示两个系列之间的关系是强正关系,如果是“-1”,表示关系是强负相关。Series.corr()

该方法有三个参数第一个是另一个系列对象,第二个是关联方法的名称,第三个是可选的min_period。series.corr()

示例 1

import pandas as pd

# create pandas Series1

series1 = pd.Series([9,2,4,6,1])

print("第一个系列对象:",series1)

# create pandas Series2

series2 = pd.Series([12,4,2,7,4])

print("第二系列对象:",series2)

# calculate the correlation

print("相关值: ", series1.corr(series2, method='pearson'))

解释

最初,我们使用 Python 整数列表创建了两个 pandas Series 对象。之后,我们使用“Pearson”方法找出两个系列对象的值之间的相关性。

输出结果

第一个系列对象: 0 9

1 2

2 4

3 6

4 1

dtype: int64

第二系列对象: 0 12

1 4

2 2

3 7

4 4

dtype: int64

相关值: 0.8471600336634684

以下示例中两个系列对象之间的相关性为“0.85”,这表明这两个系列对象具有强正相关。

示例 2

import pandas as pd

import numpy as np

# create pandas Series1

series1 = pd.Series([12,np.nan,47,19,10])

print("第一个系列对象:",series1)

# create pandas Series2

series2 = pd.Series([9,4,2,np.nan,4])

print("第二系列对象:",series2)

# calculate the correlation

print("相关值: ", series1.corr(series2, method='pearson'))

解释

最初,我们使用 python 整数列表创建了两个 pandas Series 对象,并且它还具有一些由numpy.nan属性创建的空值。之后,我们再次使用“Pearson”方法找出两个系列对象的值之间的相关性。

输出结果

第一个系列对象:

0 12.0

1  NaN

2 47.0

3 19.0

4 10.0

dtype: float64

第二系列对象:

0 9.0

1 4.0

2 2.0

3 NaN

4 4.0

dtype: float64

相关值: -0.6864226486537492

下例中两个系列对象之间的相关性为“-0.69”,表示两个系列对象之间存在强负相关。

以上是 series.corr() 方法在 pandas 中是如何工作的? 的全部内容, 来源链接: utcz.com/z/297330.html

回到顶部