今天处理一些dat文件的时候,要进行批量转换成CSV文件,如果直接进行转换会遇到一行中有多个数据的问题,因此要进行替换,操作程序如下:
import os
import pandas as pd
path =r'数据集旧文件夹名称' # 旧文件存放目录目录
path_new = r'数据集新文件夹名称' # 新文件存放的目录
filelist = os.listdir(path) # 目录下所有的文件列表
for files in filelist:
yuan_path = os.path.join(path, files)
file_name = os.path.splitext(files)[0] #文件名
Newdir = os.path.join(path_new,str(file_name)+'.csv')
data=[]
with open(yuan_path, 'r',encoding='utf-8-sig') as df:
for line in df:
data.append(list(line.strip().split()))
dataset=pd.DataFrame(data)
dataset.to_csv(Newdir,index=None)
运行结束就会在对应的新文件夹下面出现转换成功的csv文件。