如果重复行在 R 数据框中大于 n,如何找到它们的计数?

要查找 R 数据框中大于 n 的重复行数,我们可以按照以下步骤操作 -

  • 首先,创建一个数据框。

  • 然后,使用 dplyr 包的 group_by_all、count 和 filter 函数计算大于某个数量的重复行。

创建数据框

让我们创建一个数据框,如下所示 -

x<-rpois(30,1)

y<-rpois(30,1)

df<-data.frame(x,y)

df

执行时,上述脚本生成以下内容output(this output will vary on your system due to randomization)-

  x y

1 1 3

2 0 2

3 0 2

4 0 2

5 2 1

6 1 0

7 0 0

8 1 2

9 1 2

10 2 1

11 0 3

12 1 1

13 1 1

14 0 0

15 0 0

16 0 1

17 0 0

18 0 1

19 0 1

20 2 0

21 1 2

22 3 1

23 1 0

24 1 0

25 1 3

26 1 0

27 1 1

28 2 1

29 1 2

30 0 4

如果重复行大于某个数字,则计算它们

加载 dplyr 包并使用 group_by_all、count 和 filter 函数来查找大于 2 的重复行数 -

x<-rpois(30,1)

y<-rpois(30,1)

df<-data.frame(x,y)

library(dplyr)

df%>%group_by_all()%>%count()%>%filter(n>2)

输出

# A tibble: 7 x 3

# Groups: x, y [7]

     x     y     n

  <int> <int> <int>

1    0    0    4

2    0    1    3

3    0    2    3

4    1    0    4

5    1    1    3

6    1    2    4

7    2    1    3

以上是 如果重复行在 R 数据框中大于 n,如何找到它们的计数? 的全部内容, 来源链接: utcz.com/z/356067.html

回到顶部