6.数据整合
以此为例
一.使用concat合并数据
主要参数 接收 作用 默认
axis
Boolean
确定合并操作横轴(0行操作,1列操作)
0
Join
String
内链接(outer)/外链接(inner)
outer
1.行操作(axis=0)
(1)内连接
pd.concat([DataFrame1,...DataFramen])
示例
(2)外连接
pd.concat([DataFrame1,...DataFrameN],join="inner")
示例
2.列操作(axis=1)
(1)内连接
pd.concat([DataFrame1,...DataFrameN],axis=1)
示例
(2)外连接
pd.concat([DataFrame1,...DataFrameN],axis=1,join="inner")
示例
二.使用append合并数据
只限与行操作,纵向操作
DataFrame1.append([DataFrame2,...DataFrameN])
示例
三.重复合并
1.主键重复
(1) merge
参数名 接收 意义 默认
left
DataFrame/Series
要添加的新数据1
无
right
DataFrame/Series
要添加的新数据2
无
how
Inner /outer /left /right
数据的连接方式
inner
on
String / sequence
两个数据合并的主键
None
left_on
String / sequence
Left 参数接收合并主键
None
right_on
String / sequence
right 参数接收合并主键
False
left_index
boolean
是否将left参数接受的index作为主键
False
right_on
boolean
是否将right参数接受的index作为主键
False
sort
boolean
是否根据连接键合并后的数据进行排序
False
suffixes
tuple
追加left/right参数接收列名的后缀
("_x","_y")
pd.merge(DataFrame1,..DataFrameN,on/left_on/right_on=[主键])
示例
(2)join
参数名称 接收 意义 默认
other
DataFrame/Series
参与连接的其他DataFrame
无
on
List/tuple
用于连接的列名
None
how
String
inner内
outer外
left左
right右
inner
lsuffix
string
追加左侧重叠列名的尾缀
无
rsuffix
string
追加右侧重叠列名的尾缀
无
sort
boolean
是否合并后排序
Flase
DataFrame1.join(DataFrame2,on=[主键])
2.内容重复
Combing
特点1: 无值,补空值
特点2: 有值,保留DataFrame1的值
DataFrame1.combine_first(DataFrame2)
示例
以上是 6.数据整合 的全部内容, 来源链接: utcz.com/z/537830.html