在 Python Pandas 中计算每个组的唯一值

要计算 Python Pandas 中每个组的唯一值,我们可以使用df.groupby('column_name')。count().

步骤

  • 创建二维、大小可变、潜在异构的表格数据df。

  • 打印输入数据帧df。

  • 使用df.groupby('rank')['id']。count()查找每组唯一值的计数并将其存储在变量“ count ”中。

  • 打印步骤 3 中的计数。

示例

import pandas as pd

df = pd.DataFrame(

    {

       "id": [1, 2, 1, 3, 5, 1, 4, 3, 6, 7],

       'rank': [1, 4, 1, 2, 1, 4, 6, 1, 5, 3]

    }

)

print"Input DataFrame 1 is:\n", df

count = df.groupby('rank')['id'].count()

print"Frequency of ranks:\n", count

输出结果
Input DataFrame 1 is:

   id  rank

0   1    1

1   2    4

2   1    1

3   3    2

4   5    1

5   1    4

6   4    6

7   3    1 

8   6    5

9   7    3

Frequency of ranks:

rank

1  4

2  1

3  1

4  2

5  1

6  1

Name: id, dtype: int64

以上是 在 Python Pandas 中计算每个组的唯一值 的全部内容, 来源链接: utcz.com/z/360763.html

回到顶部