Python – 重塑 Pandas DataFrame 中的数据
我们可以通过对特定列进行分类来轻松重塑数据。在这里,我们将以数字形式对“结果”列进行分类,即通过和失败值。
导入所需的库 -
import pandas as pd
创建一个具有 2 列的 DataFrame -
dataFrame = pd.DataFrame({
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
使用该map()函数重塑数据,只需将“通过”设置为 1,将“失败”设置为 0 -
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
示例
以下是代码 -
import pandas as pd输出结果# 创建数据帧
dataFrame = pd.DataFrame(
{
"Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
}
)
print"DataFrame ...\n",dataFrame
# 重塑为数字
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })
print"\nReshaped DataFrame ...\n",dataFrame
这将产生以下输出
DataFrame ...Result Student
0 Pass Jack
1 Fail Robin
2 Fail Ted
3 Pass Scarlett
4 Pass Kat
Reshaped DataFrame ...
Result Student
0 1 Jack
1 0 Robin
2 0 Ted
3 1 Scarlett
4 1 Kat
以上是 Python – 重塑 Pandas DataFrame 中的数据 的全部内容, 来源链接: utcz.com/z/360935.html