excel交叉表的数据清理

之前在做一个excel的简单教程的时候:
B站的一个Excel简单教程

当时演示应该把交叉表(图1)转换成数据表格(图2)的形式。

《excel交叉表的数据清理》

《excel交叉表的数据清理》

但是在excel里没有直接实现这个需求的函数,R的tidyr包有一个spread可以实现这功能,但是,毕竟是R。

python同样可以实现这个需求,借助openpyxl这个包和excel互动,然后用一点代码就可以完成了:

from openpyxl import Workbook,load_workbook
from openpyxl.utils import get_column_letter
wb = load_workbook('测试.xlsx')
ws = wb.active
rcList = tuple(ws.rows)
print(rcList)
def spreadIt(rcList,rowVarName='var1',colVarName='var2',cellVarName='var3'):
    rLength = len(rcList)
    cLength = len(rcList[0])
    rst = [[rowVarName,colVarName,cellVarName]]
    for i in range(1,rLength):
        for j in range(1,cLength):
            rst.append([rcList[i][0].value, rcList[0]
                        [j].value, rcList[i][j].value])
    return rst

def write2Sheet(spreaded,worksheet):
    for i in range(len(spreaded)):
        for j in range(len(spreaded[0])):
            worksheet["%s%d"%(get_column_letter(j+1),i+1)]=spreaded[i][j]

wbNew = Workbook()
wsNew = wbNew.active
write2Sheet(spreadIt(rcList,rowVarName='节数',colVarName='星期',cellVarName='课程'),wsNew)

wbNew.save(filename='test.xlsx')
    原文作者:beneon
    原文地址: https://segmentfault.com/a/1190000015141544
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞