Python Pandas数据中对时间的操作

Pandas中对 时间 这个属性的处理有非常非常多的操作。

而本文对其中一个大家可能比较陌生的方法进行讲解。其他的我会陆续上传。

应用情景是这样的:考虑到有一个数据集,数据集中有用户注册账号的时间(年-月-日),如下图格式。


如果我们希望对用户账号注册时间转为具体的天数,我们可以用如下代码。

import pandas as pd

td=data['user_reg_tm']

Time=pd.to_datetime(td)

Start=pd.datetime(2016,4,16)

day=Start-Time

最后,把天数插入到原来的表中

data['Day']=day



下面简单的说一下一个时间的创建一些细节。

date=pd.Series(['2016411'])

pd.to_datetime(date)

这样就创建一个时间为 2016-4-11的时间值。

这里有个细节,就是字符串里的时间格式,年月日之间如果没有分隔,pandas会自动用-号分开,如果要自己手动分隔,例如

date=pd.Series(['2016-4-11'])

这也可以,或者用/号。但是注意,只能用- 或者/来进行分隔,不可使用别的。

有时候我们还需要有时分秒的信息。

date=pd.Series(['2016-4-11 12:12:12'])

最后再说下一个问题,上面我获得的天数后我们怎么单独取出“天数”来呢?

很简单,用.days来访问。

对于 Series类型,用 data.dt.days

对于 Timedelta类型,可以直接访问  即 data.days。

例如:

因为data['Day']是Series类型的

data['Day'].dt.days

因为day是Timedelta类型的

day.days

更新:时间处理下篇链接点击打开链接

以上是 Python Pandas数据中对时间的操作 的全部内容, 来源链接: utcz.com/z/318455.html

回到顶部