Python教程:如何用openpyxl操作Excel的三个对象

python

作为常用的处理电子表格软件,Excel基本上都有接触过。本篇文章从Excel文件的三个对象 入手,用openpyxl简化在Excel中的操作。


Excel文件三个对象

  • workbook: 工作簿,一个excel文件包含多个sheet。

  • sheet:工作表,一个workbook有多个,表名识别,如“sheet1”,“sheet2”等。

  • cell: 单元格,存储数据对象


1.新建表

A workbook至少创建一个worksheet.

通过openpyxl.workbook.Workbook.active()得到worksheet


wb = Workbook(encoding='UTF-8')

ws = wb.active


注意:

该方法使用_active_sheet_index属性, 默认会设置0,也就是第一个worksheet。除非手动修改,否则使用active方法得到都是第一个worksheet。


你也可以创建worksheets,通过 openpyxl.workbook.Workbook.create_sheet() 方法:


ws = wb.create_sheet("Mysheet") #插入到最后(default)

#或者

ws = wb.create_sheet("Mysheet", 0) #插入到最开始的位置


创建的sheet的名称会自动创建,按照sheet,sheet1,sheet2自动增长,通过title属性可以修改其名称。


ws.title = "New Title"

ws = wb.create_sheet(title="Pip")


默认的sheet的tab是白色的,可以通过 RRGGBB颜色来修改sheet_properties.tabColor属性从而修改sheet tab按钮的颜色:


ws.sheet_properties.tabColor = "1072BA"


当你设置了sheet的名称,可以将其看成workbook中的一个key。也可以使用openpyxl.workbook.Workbook.get_sheet_by_name() 方法

单元格赋值


#设定单元格的值,三种方式

sheet.cell(row=2,column=5).value=99

sheet.cell(row=3,column=5,value=100)

ws['A4'] = 4 #write


逐行写


ws.append(iterable)

#添加一行到当前sheet的最底部(即逐行追加从第一行开始) iterable必须是list,tuple,dict,range,generator类型的。 1,如果是list,将list从头到尾顺序添加。 2,如果是dict,按照相应的键添加相应的键值。

ws.append([‘This is A1', ‘This is B1', ‘This is C1'])

ws.append({‘A' : ‘This is A1', ‘C' : ‘This is C1'})

ws.append({1 : ‘This is A1', 3 : ‘This is C1'})

2.读表操作


#打开文件:

from openpyxl import load_workbook

excel=load_workbook('E:/test.xlsx')

#获取sheet:

table = excel.get_sheet_by_name('Sheet1')  #通过表名获取

#获取行数和列数:

rows=table.max_row  #获取行数

cols=table.max_column  #获取列数

#获取单元格值:

Data=table.cell(row=row,column=col).value #获取表格内容,是从第一行第一列是从1开始的,注意不要丢掉 .value

#通过名字

 ws = wb["frequency"]

 #等同于 ws2 = wb.get_sheet_by_name('frequency')

 #不知道名字用index

 sheet_names = wb.get_sheet_names()

 ws = wb.get_sheet_by_name(sheet_names[index])# index为0为第一张表

#或者

 ws =wb.active

 # 等同于 ws = wb.get_active_sheet() #通过_active_sheet_index设定读取的表,默认0读第一个表

 #活动表表名

 wb.get_active_sheet().title


单元格使用


c = ws['A4']

d = ws.cell(row = 4, column = 2) #行列读写


逐行读取


#逐行读

   ws.iter_rows(range_string=None, row_offset=0, column_offset=0): range-string(string)-单元格的范围:例如('A1:C4') row_offset-添加行 column_offset-添加列

 # 返回一个生成器, 注意取值时要用value,例如:

 for row in ws.iter_rows('A1:C2'):

   for cell in row:

     print cell

 #读指定行、指定列:

 rows=ws.rows#row是可迭代的

 columns=ws.columns#column是可迭代的

 #打印第n行数据

 print rows[n]#不需要用.value

 print columns[n]#不需要用.value


显示有多少张表


wb.get_sheet_names()

#显示表名,表行数,表列数  

print ws.title

print ws.max_row

print ws.max_column


公式计算formulae


ws["A1"] = "=SUM(1, 1)"

ws["A1"] = "=SUM(B1:C1)"

3.操作实例


#-*-coding:utf-8-*-

# Time:2017/9/21 19:02

# Author:YangYangJun

from openpyxl import Workbook

from openpyxl.reader.excel import load_workbook

import os

import time

def writeExcel():

 # 获取文件路径

 excelPath = os.path.join(os.getcwd(), 'ExcelData')

 print "****"

 print excelPath

 # 定义文件名称

 # invalid mode ('wb') or filename: 'Excel2017-09-21_20:15:57.xlsx'  这种方式明明文件,会提示保存失败,无效的文件名。

 # nameTime = time.strftime('%Y-%m-%d_%H:%M:%S')

 nameTime = time.strftime('%Y-%m-%d_%H-%M-%S')

 excelName = 'Excel' + nameTime + '.xlsx'

 ExcelFullName= os.path.join(excelPath,excelName)

 print ExcelFullName

 wb = Workbook()

 ws = wb.active

 tableTitle = ['userName', 'Phone', 'age', 'Remark']

 # 维护表头

 #    if row < 1 or column < 1:

 #     raise ValueError("Row or column values must be at least 1")

 # 如上,openpyxl 的首行、首列 是 (1,1)而不是(0,0),如果坐标输入含有小于1的值,提示 :Row or column values must be at least 1,即最小值为1.

 for col in range(len(tableTitle)):

   c = col + 1

   ws.cell(row=1, column=c).value = tableTitle[col]

 # 数据表基本信息

 tableValues = [['张学友', 15201062100, 18, '测试数据!'], ['李雷', 15201062598, 19, '测试数据!'],['Marry', 15201062191, 28, '测试数据!']]

 for row in range(len(tableValues)):

   ws.append(tableValues[row])

 #wb.save(ExcelFullName)

 wb.save(filename=ExcelFullName)

 return ExcelFullName

def readExcel(ExcelFullName):

 wb = load_workbook(ExcelFullName)

 #wb = load_workbook(filename=ExcelFullName)

 # 获取当前活跃的worksheet,默认就是第一个worksheet

 #ws = wb.active

 # 当然也可以使用下面的方法

 # 获取所有表格(worksheet)的名字

 sheets = wb.get_sheet_names()

 print sheets

 # # 第一个表格的名称

 sheet_first = sheets[0]

 # # 获取特定的worksheet

 #

 ws = wb.get_sheet_by_name(sheet_first)

 print "***"

 print sheet_first

 print ws.title

 print "^^^"

 # 获取表格所有行和列,两者都是可迭代的

 rows = ws.rows

 print rows

 columns = ws.columns

 # 迭代所有的行

 for row in rows:

   line = [col.value for col in row]

   print line

 # 通过坐标读取值

 print ws['A1'].value # A表示列,1表示行

 print ws.cell(row=1, column=1).value

if __name__ == '__main__':

 ExcelFullName = writeExcel()

 readExcel(ExcelFullName)

# 显示表名,表行数,表列数

print "Work Sheet Titile:", ws.title

print "Work Sheet Rows:", ws.max_row

print "Work Sheet Cols:", ws.max_column

openpyxl上手使用很容易,但要深入的掌握有一定的难度,大家空闲的时候一定要勤加练习。更多Python学习推荐:云海天Python教程网

以上是 Python教程:如何用openpyxl操作Excel的三个对象 的全部内容, 来源链接: utcz.com/z/529662.html

回到顶部