Python pandas 中有哪些文本数据类型?

有两种方法可以在 python pandas 中存储文本数据(适用于 1.0.0. 至最新版本 1.2.4)。在这一点上,我们可以说 Pandas 文本数据有两种数据类型,即 object 和 StringDtype。

在旧版本的pandas (1.0) 中,只有object dtype 可用,在新版本的pandas 中建议使用StringDtype 来存储所有文本数据。为了克服使用 objects dtype 的一些缺点,在 pandas 1.0 版本中引入了这个 StringDtype。尽管如此,我们仍然可以将 object 和 StringDtype 用于文本数据。

让我们举个例子,其中使用文本数据创建一个 DataFrame 并查看 Pandas 文本数据中的输出默认 dtype。

对象数据类型

使用文本数据创建一个 Pandas DataFrame 并验证数据的 dtype。

示例

dict_ = {'A':['a','Aa'],'B':['b','Bb']} # 声明字典

df = pd.DataFrame(dict_) # 使用字典创建数据帧

print(df['A']) # 打印 A 列值

print() # 在每个输出之间留出空间

print(df['B']) # Printing column B values

解释

在上面的代码中,使用字符串数据创建了一个字典并将其分配给 dict_ 变量,通过使用这个 dict_ 我们创建了一个 Pandas DataFrame。这个 DataFrame 有 2 列和 2 行,这个 DataFrame 中存在的总数据是字符串数据。

从上面代码的最后 3 行显示每一列数据,在该输出中,我们可以看到数据的 dtype。让我们验证下面的输出。

输出结果

0     a

1    Aa

Name: A, dtype: object

0      b

1     Bb

Name: B, dtype: object

上面的输出代表了我们的 DataFrame 中每个 A 列和 B 列的值,由行空间分隔。在这里我们可以看到默认情况下代表对象的每列的 dtype。要定义 StringDtype,我们需要明确说明它。

字符串数据类型

要定义 String dtype,我们可以使用 dtype 参数并分配字符串或 StringDtype 参数。让我们看看下面的一些例子。

示例

list_ = ['python','sample', 'string']

ds = pd.Series(list_, dtype='string')

print(ds)

解释

在这里,我们通过使用带有字符串列表的 pandas series 方法来定义一个 pandas Series。我们将字符串参数传递给 Parameter dtype,它将默认对象 dtype 更改为字符串。

输出结果

0     python

1     sample

2     string

dtype: string

上面的块是系列数据的输出,这里数据的dtype是一个字符串。我们还可以使用将 dtype 定义为字符串。让我们再举一个例子。pd.StringDtype()

示例

data = ['john','dev','philip'] # creating a list

ds = pd.Series(data, dtype= pd.StringDtype()) # Series creation

ds

对于这个例子,我们还采用了一个带有字符串列表和pd.StringDtype参数 dtype 的定义参数的 Pandas 系列。

输出结果

0    John

1    Dev

2    Philip

dtype: string

这里pd.StringDtypedtype 参数的参数输出显示在块上方。

以上是 Python pandas 中有哪些文本数据类型? 的全部内容, 来源链接: utcz.com/z/350406.html

回到顶部