用Python编写程序以删除给定数据框中的第一个重复行
假设您有一个数据框,删除第一个重复行的结果是,
Id Age0 1 12
3 4 13
4 5 14
5 6 12
6 2 13
7 7 16
8 3 14
9 9 15
10 10 14
解决方案
为了解决这个问题,我们将遵循以下步骤-
定义一个数据框
在“ Id”和“ Age”列中应用drop_duplicates函数,然后将keep初始值分配为“ last”。
df.drop_duplicates(subset=['Id','Age'],keep='last')
将结果存储在相同的数据框中并打印
例子
让我们看一下下面的实现以获得更好的理解-
import pandas as pddf = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10],
'Age':[12,13,14,13,14,12,13,16,14,15,14]
})
print("DataFrame is:\n",df)
df = df.drop_duplicates(subset=['Id','Age'],keep='last')
print("Dataframe after removing first duplicate rows:\n", df)
输出
DataFrame is:Id Age
0 1 12
1 2 13
2 3 14
3 4 13
4 5 14
5 6 12
6 2 13
7 7 16
8 3 14
9 9 15
10 10 14
Dataframe after removing first duplicate rows:
Id Age
0 1 12
3 4 13
4 5 14
5 6 12
6 2 13
7 7 16
8 3 14
9 9 15
10 10 14
以上是 用Python编写程序以删除给定数据框中的第一个重复行 的全部内容, 来源链接: utcz.com/z/320108.html