series.corr() 方法在 pandas 中是如何工作的?
大熊猫。用于计算排除缺失值的两个系列对象之间相关性的方法。结果,它返回一个从-1到1变化的浮点值。如果输出是整数1,表示两个系列之间的关系是强正关系,如果是“-1”,表示关系是强负相关。Series.corr()
该方法有三个参数第一个是另一个系列对象,第二个是关联方法的名称,第三个是可选的min_period。series.corr()
示例 1
import pandas as pd# create pandas Series1
series1 = pd.Series([9,2,4,6,1])
print("第一个系列对象:",series1)
# create pandas Series2
series2 = pd.Series([12,4,2,7,4])
print("第二系列对象:",series2)
# calculate the correlation
print("相关值: ", series1.corr(series2, method='pearson'))
解释
最初,我们使用 Python 整数列表创建了两个 pandas Series 对象。之后,我们使用“Pearson”方法找出两个系列对象的值之间的相关性。
输出结果
第一个系列对象: 0 91 2
2 4
3 6
4 1
dtype: int64
第二系列对象: 0 12
1 4
2 2
3 7
4 4
dtype: int64
相关值: 0.8471600336634684
以下示例中两个系列对象之间的相关性为“0.85”,这表明这两个系列对象具有强正相关。
示例 2
import pandas as pdimport numpy as np
# create pandas Series1
series1 = pd.Series([12,np.nan,47,19,10])
print("第一个系列对象:",series1)
# create pandas Series2
series2 = pd.Series([9,4,2,np.nan,4])
print("第二系列对象:",series2)
# calculate the correlation
print("相关值: ", series1.corr(series2, method='pearson'))
解释
最初,我们使用 python 整数列表创建了两个 pandas Series 对象,并且它还具有一些由numpy.nan属性创建的空值。之后,我们再次使用“Pearson”方法找出两个系列对象的值之间的相关性。
输出结果
第一个系列对象:0 12.0
1 NaN
2 47.0
3 19.0
4 10.0
dtype: float64
第二系列对象:
0 9.0
1 4.0
2 2.0
3 NaN
4 4.0
dtype: float64
相关值: -0.6864226486537492
下例中两个系列对象之间的相关性为“-0.69”,表示两个系列对象之间存在强负相关。
以上是 series.corr() 方法在 pandas 中是如何工作的? 的全部内容, 来源链接: utcz.com/z/297330.html