Python pandas 中有哪些文本数据类型?
有两种方法可以在 python pandas 中存储文本数据(适用于 1.0.0. 至最新版本 1.2.4)。在这一点上,我们可以说 Pandas 文本数据有两种数据类型,即 object 和 StringDtype。
在旧版本的pandas (1.0) 中,只有object dtype 可用,在新版本的pandas 中建议使用StringDtype 来存储所有文本数据。为了克服使用 objects dtype 的一些缺点,在 pandas 1.0 版本中引入了这个 StringDtype。尽管如此,我们仍然可以将 object 和 StringDtype 用于文本数据。
让我们举个例子,其中使用文本数据创建一个 DataFrame 并查看 Pandas 文本数据中的输出默认 dtype。
对象数据类型
使用文本数据创建一个 Pandas DataFrame 并验证数据的 dtype。
示例
dict_ = {'A':['a','Aa'],'B':['b','Bb']} # 声明字典df = pd.DataFrame(dict_) # 使用字典创建数据帧
print(df['A']) # 打印 A 列值
print() # 在每个输出之间留出空间
print(df['B']) # Printing column B values
解释
在上面的代码中,使用字符串数据创建了一个字典并将其分配给 dict_ 变量,通过使用这个 dict_ 我们创建了一个 Pandas DataFrame。这个 DataFrame 有 2 列和 2 行,这个 DataFrame 中存在的总数据是字符串数据。
从上面代码的最后 3 行显示每一列数据,在该输出中,我们可以看到数据的 dtype。让我们验证下面的输出。
输出结果
0 a1 Aa
Name: A, dtype: object
0 b
1 Bb
Name: B, dtype: object
上面的输出代表了我们的 DataFrame 中每个 A 列和 B 列的值,由行空间分隔。在这里我们可以看到默认情况下代表对象的每列的 dtype。要定义 StringDtype,我们需要明确说明它。
字符串数据类型
要定义 String dtype,我们可以使用 dtype 参数并分配字符串或 StringDtype 参数。让我们看看下面的一些例子。
示例
list_ = ['python','sample', 'string']ds = pd.Series(list_, dtype='string')
print(ds)
解释
在这里,我们通过使用带有字符串列表的 pandas series 方法来定义一个 pandas Series。我们将字符串参数传递给 Parameter dtype,它将默认对象 dtype 更改为字符串。
输出结果
0 python1 sample
2 string
dtype: string
上面的块是系列数据的输出,这里数据的dtype是一个字符串。我们还可以使用将 dtype 定义为字符串。让我们再举一个例子。pd.StringDtype()
示例
data = ['john','dev','philip'] # creating a listds = pd.Series(data, dtype= pd.StringDtype()) # Series creation
ds
对于这个例子,我们还采用了一个带有字符串列表和pd.StringDtype参数 dtype 的定义参数的 Pandas 系列。
输出结果
0 John1 Dev
2 Philip
dtype: string
这里pd.StringDtypedtype 参数的参数输出显示在块上方。
以上是 Python pandas 中有哪些文本数据类型? 的全部内容, 来源链接: utcz.com/z/350406.html