如果重复行在 R 数据框中大于 n,如何找到它们的计数?
要查找 R 数据框中大于 n 的重复行数,我们可以按照以下步骤操作 -
首先,创建一个数据框。
然后,使用 dplyr 包的 group_by_all、count 和 filter 函数计算大于某个数量的重复行。
创建数据框
让我们创建一个数据框,如下所示 -
x<-rpois(30,1)y<-rpois(30,1)
df<-data.frame(x,y)
df
执行时,上述脚本生成以下内容output(this output will vary on your system due to randomization)-
x y1 1 3
2 0 2
3 0 2
4 0 2
5 2 1
6 1 0
7 0 0
8 1 2
9 1 2
10 2 1
11 0 3
12 1 1
13 1 1
14 0 0
15 0 0
16 0 1
17 0 0
18 0 1
19 0 1
20 2 0
21 1 2
22 3 1
23 1 0
24 1 0
25 1 3
26 1 0
27 1 1
28 2 1
29 1 2
30 0 4
如果重复行大于某个数字,则计算它们
加载 dplyr 包并使用 group_by_all、count 和 filter 函数来查找大于 2 的重复行数 -
x<-rpois(30,1)y<-rpois(30,1)
df<-data.frame(x,y)
library(dplyr)
df%>%group_by_all()%>%count()%>%filter(n>2)
输出
# A tibble: 7 x 3# Groups: x, y [7]
x y n
<int> <int> <int>
1 0 0 4
2 0 1 3
3 0 2 3
4 1 0 4
5 1 1 3
6 1 2 4
7 2 1 3
以上是 如果重复行在 R 数据框中大于 n,如何找到它们的计数? 的全部内容, 来源链接: utcz.com/z/356067.html