python入门之对比两份excel表格数据

今天老大交给我一个任务,对比两个版本的excel数据的异同(增删情况),唉,说多了都是泪,自从学会了python,再也不用担心老大这样的任务了~~~
好了直接上代码吧,代码中解释

import xlrd
import xlwt
#from xlutils.copy import copy #暂时用不上
import os

l_p=[]#定义两个全局list,分别存储原始和目的需要对比的数据
l_t=[]

def read_excel():
    wb_pri = xlrd.open_workbook('verp.xlsx')#打开原始文件
    wb_tar = xlrd.open_workbook('vert.xlsx')#打开目标文件
    wb_result = xlwt.Workbook()#新建一个文件,用来保存结果
    sheet_result = wb_result.add_sheet('result',cell_overwrite_ok=True)
    result_i =0
    result_j =0
    for sheet_i in range(2,21):
        sheet_pri = wb_pri.sheet_by_index(sheet_i) #通过index获取每个sheet,为了省心,我根据自己的需要限定为第2-21个sheet
        sheet_tar = wb_tar.sheet_by_index(sheet_i)
        sheet_backup = wb_backup.get_sheet(sheet_i)
        print(sheet_pri.name,sheet_tar.name)
        #为什么是取这一列,因为这就是需要对比的数据阿 
        l_p = sheet_pri.col_values(2)
        l_t = sheet_tar.col_values(2)

        #tmp =[var for val in a if val in b] #这个是求交集,老大没要求是用不上的
        #求参数在pri(原始数据)中存在,而在tar(目标)中不存在的
        tmp_pd = list(set(l_p).difference(set(l_t)))
        #求参数在tar中存在,而在pri中不存在的
        tmp_td = list(set(l_t).difference(set(l_p)))
        
        if result_i <result_j:
            result_i =result_j
        else:
            result_j =result_i
        for pd_i in tmp_pd:
            result_i = result_i+1
            sheet_result.write(result_i,0,sheet_pri.name)
            sheet_result.write(result_i,2,pd_i)
        for td_i in tmp_td:
            result_j =result_j +1
            sheet_result.write(result_j,1,sheet_tar.name)
            sheet_result.write(result_j,3,td_i)
    #好了,可以去名为result的excel中查看结果了
    wb_result.save('result.xls') 
 
if __name__ == '__main__':
  read_excel()
    原文作者:python
    原文地址: https://segmentfault.com/a/1190000007824454
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞