Python pandas 包中的数据结构是什么?
数据结构是一种收集数据、组织和存储格式的方式,使我们能够以有效的方式访问和修改数据。它是数据类型的集合。它为您提供了组织items(values)记忆的最佳方式。
python pandas 包以有效的方式处理数据,因为它有两个强大的数据结构,名为 Series 和 DataFrames。
Series只不过是一个一维带标签的数组,它可以容纳任何数据类型。它可以存储整数值、字符串、浮点数等。 Series 中的每个值都分配给 a label(assigned to an index),标签可以是整数值,也可以是名称表示。
示例
import pandas as pddata = pd.Series([1,2,3,4,5])
print(data)
解释
Pandas Series 数据结构是通过使用具有 5 个元素的简单 Python 列表定义的。通过使用 import 关键字,我们导入了 pandas 包,然后我们使用 pandas 创建了系列。系列功能。
输出结果
0 11 2
2 3
3 4
4 5
dtype: int64
系列的输出在上面的块中表示,我们可以观察到熊猫系列是一个一维对象,它存储同构数据,系列中的每个值都由一个标签表示。对于我们上面的示例标签值是 0,1,2,3,4。
pandas 中的另一个数据结构是DataFrame,它是一个二维标记的数据结构,用于以行和列格式表示。每列中存在的数据可能具有不同的数据类型。DataFrame 的整体结构看起来类似于电子表格或 SQL 表。与 Series 一样,DataFrame 行也用标签表示。
示例
import pandas as pddf = pd.DataFrame([[2,3,4,5],[6,7,8,9]], columns=['a','b','c','d'])
print(df)
解释
在上面的示例中,我们使用列表列表创建了一个简单的 Pandas DataFrame,这里的列标签手动定义为 a、b、c、d。
输出结果
a b c d0 2 3 4 5
1 6 7 8 9
pandas DataFrame 的输出可以在上面的输出块中看到,DataFrame 是用 2 行 4 列创建的,0,1 和 a,b,c,d 是各自的行和列标签。
在 pandas 0.20.0 版本之前,有一个 3-Dimensional 数据结构可用,该数据结构称为panel。在较新版本的 Pandas 中,这些面板的 3 维数据表示为 MultiIndex DataFrame。
以上是 Python pandas 包中的数据结构是什么? 的全部内容, 来源链接: utcz.com/z/322639.html