用Python编写程序以删除给定数据框中的第一个重复行

假设您有一个数据框,删除第一个重复行的结果是,

    Id Age

0    1 12

3    4 13

4    5 14

5    6 12

6    2 13

7    7 16

8    3 14

9    9 15

10  10 14

解决方案

为了解决这个问题,我们将遵循以下步骤-

  • 定义一个数据框

  • 在“ Id”和“ Age”列中应用drop_duplicates函数,然后将keep初始值分配为“ last”。

df.drop_duplicates(subset=['Id','Age'],keep='last')

  • 将结果存储在相同的数据框中并打印

例子

让我们看一下下面的实现以获得更好的理解-

import pandas as pd

df = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10],

                     'Age':[12,13,14,13,14,12,13,16,14,15,14]

                  })

print("DataFrame is:\n",df)

df = df.drop_duplicates(subset=['Id','Age'],keep='last')

print("Dataframe after removing first duplicate rows:\n", df)

输出

DataFrame is:

    Id    Age

0    1    12

1    2    13

2    3    14

3    4    13

4    5    14

5    6    12

6    2    13

7    7    16

8    3    14

9    9    15

10  10    14

Dataframe after removing first duplicate rows:

    Id Age

0    1 12

3    4 13

4    5 14

5    6 12

6    2 13

7    7 16

8    3 14

9    9 15

10  10 14

以上是 用Python编写程序以删除给定数据框中的第一个重复行 的全部内容, 来源链接: utcz.com/z/320108.html

回到顶部