python pandas 对series和dataframe的重置索引reindex方法

reindex更多的不是修改pandas对象的索引,而只是修改索引的顺序,如果修改的索引不存在就会使用默认的None代替此行。且不会修改原数组,要修改需要使用赋值语句。

series.reindex()

import pandas as pd

import numpy as np

obj = pd.Series(range(4), index=['d', 'b', 'a', 'c'])

print obj

d 0

b 1

a 2

c 3

dtype: int64

print obj.reindex(['a', 'b', 'c', 'd', 'e'])

1

a 2.0

b 1.0

c 3.0

d 0.0

e NaN

dtype: float64

多出的索引‘e'会被赋值NaN

内插或填充method

obj1=pd.Series(range(3), index=['a', 'c', 'e'])

print obj1.reindex(['a', 'b', 'c', 'd', 'e'],method='pad')

a 0

b 0

c 1

d 1

e 2

dtype: int64

ffill或pad: 前向(或进位)填充

bfill或backfill: 后向(或进位)填充

dataframe.reindex()

dataframe.reindex()可以改变(行)索引,列或两者。当只传入一个序列时,行被重新索引,一次可以对两个重新索引,可是插值只在行侧(0坐标轴)进行

frame = pd.DataFrame(np.arange(9).reshape((3, 3)), index=['a', 'c', 'd'], columns=['c1', 'c2', 'c3'])

print frame

c1 c2 c3

a 0 1 2

c 3 4 5

d 6 7 8

states = ['c1', 'b2', 'c3']

frame.reindex(columns=states)

c1b2c3
a0NaN2
c3NaN5
d6NaN8

列名不一样的会被赋值nan

frame_na=frame.reindex(index=['a', 'b', 'c', 'd'], method='ffill', columns=states)

print frame_na

c1 b2 c3

a 0 NaN 2

b 0 NaN 2

c 3 NaN 5

d 6 NaN 8

插值只在行侧(0坐标轴)进行,但是我们可以在其之后,对nan值进行填充

frame_na.fillna(method='ffill',axis=1)

c1b2c3
a0.00.02.0
b0.00.02.0
c3.03.05.0
d6.06.08.0

以上这篇python pandas 对series和dataframe的重置索引reindex方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

以上是 python pandas 对series和dataframe的重置索引reindex方法 的全部内容, 来源链接: utcz.com/z/324290.html

回到顶部