Python数据分析重要库Pandas:数据清洗后的数据整合

python

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

 

Pandas合并数据

组合或合并数据时,pandas 有几个不同选项。在 Jupyter的Notebook中,创建两个新的数据帧并合并数据。可以使用 append() 来合并这些数据帧。【案例】将城市名,人口和面积的两组数据合并。

 

A..append()

 

 

 

import pandas as pd

data = {"city":["London","Manchester","Birmingham","Leeds","Glasgow"],

"population": [9787426, 2553379,2440986,1777934,1209143],

"area":[1737.9,630.3,598.9,487.8, 368.5 ]}

cities = pd.DataFrame(data)

data2 = {"city":["Liverpool","Southampton"],

"population": [864122, 855569],

"area":[199.6, 192.0]}

cities2 = pd.DataFrame(data2)

cities = cities.append(cities2)

cities

其操作是“data1 = data1.append(data2)” 将data2连接到data1的尾部。再赋值给data1。要注意data1和data2应具有相同的结构。

B..concat()

frames = [cities, cities2]

df = pd.concat(frames)

df

像其在ndarray上的同级函数一样numpy.concatenate(),pandas.concat()采用同类对象的列表或字典。

 

frames = [cities, cities2]

df = pd.concat(frames, keys=["x", "y"])

df

加入关键字keys参数进行不同数据来源的区分。

 

然后可以根据数据来源直接查看定位所需的数据。

df.loc["y"]

 

以上文章来源于源一学园,作者 房媛

转载地址

https://blog.csdn.net/fei347795790?t=1

以上是 Python数据分析重要库Pandas:数据清洗后的数据整合 的全部内容, 来源链接: utcz.com/z/530885.html

回到顶部