python读入csv后不能控制对应列的问题

import pandas as pd
reader=pd.read_csv('D:/scut_lastproject_dataset/august_week1_csv/uniq/augustweek1.csv',chunksize=1000,iterator=True)
file1 = reader.get_chunk(1000)
file1.columns=['souceip','sourceport','destport','protocol','flags','fwd','stos','pkt','byt','attack_type']
print(file1)

这里重新修改列名为10个

图片描述

截图中选取了结果,实际上是有13列的,但读入之后size变成十列的了,但是数据还在却无法进行列名的修改
图片描述

这是csv打开的截图,第二行的数据是无用的,不知道是不是有影响。因为数据集是30G的,所以删了再保存的话数据会丢失。所以该怎么办好,急急急!

回答:

你用read_csv的时候,加上skiprows 参数,要求忽略第二行就好了啊。

以上是 python读入csv后不能控制对应列的问题 的全部内容, 来源链接: utcz.com/a/161920.html

回到顶部