如何使用Python中已经存在的列将新列创建到数据框?

数据框是一种二维数据结构,其中数据以表格格式存储,以行和列的形式。它可以可视化为SQL数据表或excel工作表表示形式。

可以使用以下构造函数创建它-

pd.Dataframe(data, index, columns, dtype, copy)

我们之前看到了一种方法,其中将新列创建为Series数据结构。这被索引到原始数据帧,因此被添加到数据帧。

让我们使用如何使用数据框已存在的列创建列。当我们需要对已经存在的列执行一些计算并将结果存储在新列中时,这很有用-

示例

import pandas as pd

my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),

'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']),

'ef' :pd.Series([56, 78, 32],index=['a','b','c'])}

my_df = pd.DataFrame(my_data)print("数据框为:")

print(my_df)

my_df['gh'] = my_df['ab'] + my_df['ef']

print("将列0和列2添加到数据帧后,:")print(my_df)

输出结果

数据框为:

   ab   cd  ef

a  1.0  1  56.0

b  8.0  2  78.0

c  7.0  0  32.0

d NaN 9 NaN

将列0和列2添加到数据帧后,:

   ab   cd  ef    gh

a  1.0  1   56.0  57.0

b  8.0  2   78.0  86.0

c  7.0  0   32.0  39.0

d  NaN  9   NaN   NaN

说明

  • 导入所需的库,并为其指定别名,以方便使用。

  • 创建由键和值组成的字典值,其中值实际上是序列数据结构。

  • 创建多个此类字典值。

  • 该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数

  • 通过将字典作为参数传递给数据帧来创建数据帧。

  • 将新列索引到数据框,并添加第0和第2列以创建此新列。

  • 数据框被打印在控制台上。

注意-“ NaN”一词指的是“不是数字”,这意味着特定的[row,col]值没有任何有效的条目。

以上是 如何使用Python中已经存在的列将新列创建到数据框? 的全部内容, 来源链接: utcz.com/z/321474.html

回到顶部