添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
首发于 Python学习专栏

Python学习第九十一天:Python操作Excel

使用python来操作Excel需要用到xlrd和xlwt这两个库,作用是在python中读取和写入excel数据,使用前需要安装和import导入;

1.Python 读 excel数据

  • 使用Python 读 excel数据,首先需要使用 xlrd.open_workbook (文件名)来打开Excel文件,默认是rb方式打开;
  • 然后可以通过xlrd库对象中的方法来获取Excel文件信息,读取excel数据;
import xlrd
from pprint import pprint
staff_excel = xlrd.open_workbook('./staff.xlsx')
# 获取这个表中,sheet工作簿的名称
print(staff_excel.sheet_names())
# 通过名字拿到对应的工作簿
sheet = staff_excel.sheet_by_name('员工基本信息')
# 显示表格的行数,和列数
print(sheet.nrows)
print(sheet.ncols)
# 读取第二行的所有cell中的内容
print(sheet.row_values(2))
# 获取第2行,第0列的值
print(sheet.cell(2,0).value)
print(sheet.cell_value(2,0))
data_type = sheet.cell(2,2).ctype
print(data_type)
if data_type is 3:
    # 返回一个元组
    # ret = xlrd.xldate_as_tuple(sheet.cell_value(1,2),staff_excel.datemode)
    # 将excel表中时间转换为python中的时间
    ret = xlrd.xldate_as_datetime(sheet.cell_value(1,2), staff_excel.datemode)  
    print(ret.strftime('%Y-%m-%d'))
  • row_values(i) col_values(i) 方法可以获取指定行数或者列数的信息,其中i是从0开始计数的,这两个方法都是返回list对象
  • cell_value(i, j) 方法可以读取单元格数据,i是行数,j是列数,行数和列数都是从0开始计数
  • 在excel中0表示empty,1表示string,2表示number,3表示date,4表示boolean,5表示error

2.将Excel数据转换为json写入到文件

  • 首先需要打开excel文件,然后通过名字拿到对应sheet,然后就可以开始操作excel表格;
  • 先创建一个空列表,获取excel表格中的第一行作为字典的key值;
    然后在局部变量中创建一个字典对象(每次新的循环,字典对象需求清空),通过两层循环(外循环控制行,内循环控制列)进行取值,将取到的值赋值给字典对象,每次循环完毕都将字典对象添加到定义的空列表中;
    要将数据写入文件中,可以使用with上下文管理器,通过 json.dumps() 方法将之前存放数据的自定义列表进行序列化,然后写入文件,想输出真正的中文需要指定参数 ensure_ascii=False
json_list = []
keys = sheet.row_values(0)
print(keys)
for index_r in range(1,sheet.nrows): # [1,2]
    # 这个字典必须是局部变量
    line = {}
    for index_c in range(sheet.ncols): # [0, 3]
        # 拿到类型
        cell_type = sheet.cell(index_r, index_c).ctype
        # 拿到值
        cell_value = sheet.cell(index_r, index_c).value
        # 如果是时间类型
        if cell_type is 3:
            cell_value = xlrd.xldate_as_datetime(cell_value, staff_excel.datemode).strftime('%Y-%m-%d')
        line[keys[index_c]] = cell_value
    else:
        json_list.append(line)
pprint(json_list, indent=4)
with open('staff.json', 'a+',) as f:
    f.write(json.dumps(json_list, ensure_ascii=False))

3.将json文件重新写入Excel

# 创建一个Excel对象文件
new_staff = xlwt.Workbook()
staff_sheet = new_staff.add_sheet('xkd员工信息')
with open('staff.json') as f:
    # 返回一个列表
    data = json.load(f)
# 获取Excel中的第一行
item = data[0]
# 获取Excel中的值
column_values = []
for item in data:
    column_values.append(item.values())
# 写入第一行
for i,key in enumerate(item.keys()):
    print(key)