Python数据分析重要库Pandas:数据清洗后的数据整合
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
Pandas合并数据
组合或合并数据时,pandas 有几个不同选项。在 Jupyter的Notebook中,创建两个新的数据帧并合并数据。可以使用 append() 来合并这些数据帧。【案例】将城市名,人口和面积的两组数据合并。
A..append()
import pandas as pddata = {"city":["London","Manchester","Birmingham","Leeds","Glasgow"],
"population": [9787426, 2553379,2440986,1777934,1209143],
"area":[1737.9,630.3,598.9,487.8, 368.5 ]}
cities = pd.DataFrame(data)
data2 = {"city":["Liverpool","Southampton"],
"population": [864122, 855569],
"area":[199.6, 192.0]}
cities2 = pd.DataFrame(data2)
cities = cities.append(cities2)
cities
其操作是“data1 = data1.append(data2)” 将data2连接到data1的尾部。再赋值给data1。要注意data1和data2应具有相同的结构。
B..concat()
frames = [cities, cities2]df = pd.concat(frames)
df
像其在ndarray上的同级函数一样numpy.concatenate(),pandas.concat()采用同类对象的列表或字典。
frames = [cities, cities2]df = pd.concat(frames, keys=["x", "y"])
df
加入关键字keys参数进行不同数据来源的区分。
然后可以根据数据来源直接查看定位所需的数据。
df.loc["y"]
以上文章来源于源一学园,作者 房媛
转载地址
https://blog.csdn.net/fei347795790?t=1
以上是 Python数据分析重要库Pandas:数据清洗后的数据整合 的全部内容, 来源链接: utcz.com/z/530885.html