问题是有相同列的两个表格合并,但是列中的值顺序不一样,所以需要用到merge函数。
import pandas as pd
import os
print(os.getcwd()) #打印出当前工作路径
df5 = pd.read_csv("C:\\Users\\hanhan\\PycharmProjects\\pythonProject\\5.csv",encoding = 'gb2312',dtype='str')
df6 = pd.read_csv("C:\\Users\\hanhan\\PycharmProjects\\pythonProject\\6.csv",encoding = 'gb2312',dtype='str')
df_pri = pd.merge(df5,df6,on='key')
df_pri.to_csv('result.csv',header=True,index=False)
首先,表格存为CSV格式。
import os
print(os.getcwd())
是为了打印出当前的工作路径,我一般把文件放在当前路径下。
打印出来的路径为C:\Users\hanhan\PycharmProjects\pythonProject
但是Python读取文件的时候会对\符号进行转义,所以可以在前面加一个r,也可以写成双斜线\\。
接着就是读取两个表格,用到的是pd.read_csv。
因为表格中有中文字符,所以使用了encoding = ‘gb2312’,国际码。
又因为怕格式不统一,、所以统一用字符串格式:dtype=’str’。
df_pri = pd.merge(df5,df6,on=’key’)
相同列的列名为key。
然后结果存为CSV文件,导出位置也在当前路径。