比较简单,直接看代码。
import pandas as pd
# 获取所有的sheet
reader = pd.ExcelFile(r'path')
sheet_names = reader.sheet_names
# 读取所有sheet的内容,并存入列表中
content = []
for i in sheet_names:
print('正在读取sheet---{}'.format(i))
df = pd.read_excel(path, sheet_names=i)
df = df.loc[:,['col1', 'col2']].drop_duplicates() #根据需求选择
content.append(df)
# 保存结果数据
writer = pd.ExcelWriter(r'path')
pd.concat(content).drop_duplicates().to_excel(writer
,'total',index=False)
writer.save()