如何检查数据框列是否在R中包含重复值?
要检查数据框列是否包含重复值,我们可以将重复函数与任何重复函数一起使用。例如,如果我们有一个名为df的数据帧,其中包含一个列ID,则可以使用以下命令检查ID是否包含重复值-
any(duplicated(df$ID))
例1
考虑以下数据帧-
ID<-1:20输出结果x<-rpois(20,1)
df1<-data.frame(ID,x)
df1
ID x1 1 4
2 2 1
3 3 2
4 4 2
5 5 1
6 6 0
7 7 1
8 8 1
9 9 0
10 10 1
11 11 1
12 12 2
13 13 1
14 14 3
15 15 1
16 16 0
17 17 0
18 18 3
19 19 2
20 20 2
检查x是否包含任何重复项-
任何(重复(df1 $x))
[1] TRUE
例2
S.No<-1:20输出结果y<-round(rnorm(20,5,3),1)
df2<-data.frame(S.No,y)
df2
S.No y1 1 5.1
2 2 5.8
3 3 4.4
4 4 10.1
5 5 3.3
6 6 6.1
7 7 4.8
8 8 12.6
9 9 6.4
10 10 8.7
11 11 1.5
12 12 2.5
13 13 2.1
14 14 8.7
15 15 5.5
16 16 2.0
17 17 2.1
18 18 5.5
19 19 5.4
20 20 3.4
检查y是否包含任何重复项-
任何(重复(df2 $y))
[1] TRUE
以上是 如何检查数据框列是否在R中包含重复值? 的全部内容, 来源链接: utcz.com/z/327643.html