Python – 重塑 Pandas DataFrame 中的数据

我们可以通过对特定列进行分类来轻松重塑数据。在这里,我们将以数字形式对“结果”列进行分类,即通过和失败值。

导入所需的库 -

import pandas as pd

创建一个具有 2 列的 DataFrame -

dataFrame = pd.DataFrame(

   {

      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']

   }

)

使用该map()函数重塑数据,只需将“通过”设置为 1,将“失败”设置为 0 -

dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

示例

以下是代码 -

import pandas as pd

# 创建数据帧

dataFrame = pd.DataFrame(

   {

      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']

   }

)

print"DataFrame ...\n",dataFrame

# 重塑为数字

dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

print"\nReshaped DataFrame ...\n",dataFrame

输出结果

这将产生以下输出

DataFrame ...

   Result   Student

0    Pass      Jack

1    Fail     Robin

2    Fail       Ted

3    Pass  Scarlett

4    Pass       Kat

Reshaped DataFrame ...

   Result   Student

0       1      Jack

1       0     Robin

2       0       Ted

3       1  Scarlett

4       1       Kat

以上是 Python – 重塑 Pandas DataFrame 中的数据 的全部内容, 来源链接: utcz.com/z/360935.html

回到顶部