计算 Pandas 中 DataFrame 列中某个值的频率

要计算 Pandas 中 DataFrame 列中某个值的频率,我们可以使用. 方法。df.groupby(column name)size()

步骤

  • 创建二维、大小可变、潜在异构的表格数据df。

  • 打印输入数据帧df。

  • 列的打印频率x。

  • 列的打印频率y。

  • 列的打印频率z。

示例

import pandas as pd

df = pd.DataFrame(

   {

      "x": [5, 2, 1, 5],

      "y": [4, 10, 5, 10],

      "z": [1, 1, 5, 1]

   }

)

print "Input DataFrame is:\n", df

col = "x"

count = df.groupby('x').size()

print "列中值的频率 ", col, "is:\n", count

col = "y"

count = df.groupby('y').size()

print "列中值的频率 ", col, "is:\n", count

col = "z"

count = df.groupby('z').size()

print "列中值的频率 ", col, "is:\n", count

输出结果
Input DataFrame is:

   x  y  z

0  5  4  1

1  2 10  1

2  1  5  5

3 5  10  1

列中值的频率 x is:

   x

1  1

2  1

5  2

dtype: int64

列中值的频率 y is:

   y

4  1

5  1

10 2

dtype: int64

列中值的频率 z is:

   z

1  3

5  1

dtype: int64

以上是 计算 Pandas 中 DataFrame 列中某个值的频率 的全部内容, 来源链接: utcz.com/z/359761.html

回到顶部