pandas读取文件常用方法与参数

编程

常用方法

df = pd.read_excel()

df = pd.read_csv()

df.to_csv()

df.to_excel()

header

header默认为0,表示第一行是表头,如果header设置为None表示没有表头

header也可以是其他整数n,表示n+1行是表头,并且前n行的数据并不会读取

usecols

需要选择哪些列,默认None

  1. None,读取所有列
  2. int,读取第几列
  3. list,int列表,表示读取这个列表中的列
  4. string,excel的方式读取,例如:"A:F"表示A到F列,"A,D,E:H"表示A和D和E到H列

names

对读取的列重命名

也可以读取数据之后再重命名:

df = pd.read_csv("data.csv")

df.columns = ["A","B","C"]

或者:

df = pd.read_csv("data.csv")

df.rename(columns = {"A":"AN","B":"BN","C":"CN"})

其他读取文件常用参数

sheet_name:读Excel的时候读取指定名称的表单,也可以是索引,默认0

index_col:指定索引列,int类型

nrows:读取哪些行

skiprows:跳过哪些行

keep_default_na:是否保留空值,默认True

dtype:设置列的类型,例如,{"a": np.float64, "b": np.int32}

写文件的常用参数

float_format:写浮点数的格式,"%.0f"

columns:列名称

header:是否输出表头,默认True

index:是否输出索引,默认True

对于csv文件还可以设置:

sep:设置分隔符,默认","

mode:设置写入模式,默认"w"

对于Excel还可以设置:

sheet_name:表单名称,默认"Sheet1"

以上是 pandas读取文件常用方法与参数 的全部内容, 来源链接: utcz.com/z/512268.html

回到顶部