Python - 使用 Numpy 在 Pandas 聚合中计算不同的数量

要计算不同,请在 Pandas 中使用 nunique。我们将分组一个列并使用 Numpy 找到 sun sum()。

首先,导入所需的库 -

import pandas as pd

import numpy as np

创建一个包含 3 列的 DataFrame。列有重复值 -

dataFrame = pd.DataFrame(

   {

      "Car": ['BMW', 'Audi', 'BMW', 'Lexus', 'Lexus'],"Place": ['Delhi','Bangalore','Delhi','Chandigarh','Chandigarh'],"Units": [100, 150, 50, 110, 90]

   }

)

计数在聚合中agg()与 nunique 不同。计算计数总和,我们使用 numpy sum()-

dataFrame = dataFrame.groupby("Car").agg({"Units": np.sum, "Place": pd.Series.nunique})

示例

以下是代码 -

import pandas as pd

import numpy as np

dataFrame = pd.DataFrame(

   {

      "Car": ['BMW', 'Audi', 'BMW', 'Lexus', 'Lexus'],"Place": ['Delhi','Bangalore','Delhi','Chandigarh','Chandigarh'],"Units": [100, 150, 50, 110, 90]

   }

)

print"DataFrame ...\n",dataFrame

# 在聚合中计数与 nunique 不同

dataFrame = dataFrame.groupby("Car").agg({"Units": np.sum, "Place": pd.Series.nunique})

print"\nUpdated DataFrame ...\n",dataFrame

输出结果

这将产生以下输出 -

DataFrame ...

     Car      Place   Units

0    BMW      Delhi    100

1   Audi  Bangalore    150

2    BMW      Delhi     50

3  Lexus Chandigarh    110

4  Lexus Chandigarh     90

Updated DataFrame ...

       Units   Place

Car

Audi    150       1

BMW     150       1

Lexus   200       1

以上是 Python - 使用 Numpy 在 Pandas 聚合中计算不同的数量 的全部内容, 来源链接: utcz.com/z/350427.html

回到顶部