6.数据整合[Python基础]

python

以此为例




一.使用concat合并数据

主要参数

接收

作用

默认

axis

Boolean

确定合并操作横轴(0行操作,1列操作)

0

Join

String

内链接(outer)/外链接(inner)

outer

1.行操作(axis=0)

(1)内连接

pd.concat([DataFrame1,...DataFramen])

示例

(2)外连接

pd.concat([DataFrame1,...DataFrameN],join="inner")

示例

2.列操作(axis=1)

(1)内连接

pd.concat([DataFrame1,...DataFrameN],axis=1)

示例

(2)外连接

pd.concat([DataFrame1,...DataFrameN],axis=1,join="inner")

示例

二.使用append合并数据

只限与行操作,纵向操作

DataFrame1.append([DataFrame2,...DataFrameN])

示例

三.重复合并

1.主键重复

(1) merge

参数名

接收

意义

默认

left

DataFrame/Series

要添加的新数据1

right

DataFrame/Series

要添加的新数据2

how

Inner /outer /left /right

数据的连接方式

inner

on

String / sequence

两个数据合并的主键

None

left_on

String / sequence

Left 参数接收合并主键

None

right_on

String / sequence

right 参数接收合并主键

False

left_index

boolean

是否将left参数接受的index作为主键

False

right_on

boolean

是否将right参数接受的index作为主键

False

sort

boolean

是否根据连接键合并后的数据进行排序

False

suffixes

tuple

追加left/right参数接收列名的后缀

("_x","_y")

pd.merge(DataFrame1,..DataFrameN,on/left_on/right_on=[主键])

示例

(2)join

参数名称

接收

意义

默认

other

DataFrame/Series

参与连接的其他DataFrame

on

List/tuple

用于连接的列名

None

how

String

inner内

outer外

left左

right右

inner

lsuffix

string

追加左侧重叠列名的尾缀

rsuffix

string

追加右侧重叠列名的尾缀

sort

boolean

是否合并后排序

Flase

DataFrame1.join(DataFrame2,on=[主键])

2.内容重复

Combing

特点1: 无值,补空值
特点2: 有值,保留DataFrame1的值

DataFrame1.combine_first(DataFrame2)

示例

以上是 6.数据整合[Python基础] 的全部内容, 来源链接: utcz.com/z/530282.html

回到顶部