pandas将具有unix时间戳(以毫秒为单位)的行转换为日期时间

我需要处理大量CSV文件,其中时间戳始终是代表以毫秒为单位的unix时间戳的字符串。我找不到有效修改这些列的方法。

这就是我想出的,但是,这当然只重复了该列,而我不得不以某种方式将其放回原始数据集。我确定创建DataFrame?时可以做到。

import sys

if sys.version_info[0] < 3:

from StringIO import StringIO

else:

from io import StringIO

import pandas as pd

data = 'RUN,UNIXTIME,VALUE\n1,1447160702320,10\n2,1447160702364,20\n3,1447160722364,42'

df = pd.read_csv(StringIO(data))

convert = lambda x: datetime.datetime.fromtimestamp(x / 1e3)

converted_df = df['UNIXTIME'].apply(convert)

这将选择“ UNIXTIME”列,并将其更改为

0    1447160702320

1 1447160702364

2 1447160722364

Name: UNIXTIME, dtype: int64

进入这个

0   2015-11-10 14:05:02.320

1 2015-11-10 14:05:02.364

2 2015-11-10 14:05:22.364

Name: UNIXTIME, dtype: datetime64[ns]

但是,我想使用类似的方法pd.apply()来获取转换后的列返回的整个数据集,或者像我已经写的那样,仅在从CSV生成DataFrame时创建日期时间。

回答:

您可以使用to_datetimearg并将其传递为后处理步骤unit='ms'

In [5]:

df['UNIXTIME'] = pd.to_datetime(df['UNIXTIME'], unit='ms')

df

Out[5]:

RUN UNIXTIME VALUE

0 1 2015-11-10 13:05:02.320 10

1 2 2015-11-10 13:05:02.364 20

2 3 2015-11-10 13:05:22.364 42

以上是 pandas将具有unix时间戳(以毫秒为单位)的行转换为日期时间 的全部内容, 来源链接: utcz.com/qa/419679.html

回到顶部