如何检查数据框列是否在R中包含重复值?

要检查数据框列是否包含重复值,我们可以将重复函数与任何重复函数一起使用。例如,如果我们有一个名为df的数据帧,其中包含一个列ID,则可以使用以下命令检查ID是否包含重复值-

any(duplicated(df$ID))

例1

考虑以下数据帧-

ID<-1:20

x<-rpois(20,1)

df1<-data.frame(ID,x)

df1

输出结果
    ID x

1   1  4

2   2  1

3   3  2

4   4  2

5   5  1

6   6  0

7   7  1

8   8  1

9   9  0

10 10  1

11 11  1

12 12  2

13 13  1

14 14  3

15 15  1

16 16  0

17 17  0

18 18  3

19 19  2

20 20  2

检查x是否包含任何重复项-

任何(重复(df1 $x))

[1] TRUE

例2

S.No<-1:20

y<-round(rnorm(20,5,3),1)

df2<-data.frame(S.No,y)

df2

输出结果
   S.No  y

1   1   5.1

2   2   5.8

3   3   4.4

4   4  10.1

5   5   3.3

6   6   6.1

7   7   4.8

8   8  12.6

9   9   6.4

10 10   8.7

11 11   1.5

12 12   2.5

13 13   2.1

14 14   8.7

15 15   5.5

16 16   2.0

17 17   2.1

18 18   5.5

19 19   5.4

20 20   3.4

检查y是否包含任何重复项-

任何(重复(df2 $y))

[1] TRUE

以上是 如何检查数据框列是否在R中包含重复值? 的全部内容, 来源链接: utcz.com/z/327643.html

回到顶部