本文我们来通过简短的代码来实现一个快速文件夹内文件名遍历功能,并把制定类型的文件名存入到表格中。
一、获取文件夹下的文件内容
想要对电脑中的文件夹进行操作,我们首先需要做的就是使用Python中的os
模块去遍历文件夹内容。方式如下:
import os
# out为路径
os.walk('out')
使用这种形式我们就能够得到该路径下所有文件的信息,但是这样简单的到的信息是一种迭代形式,我们需要循环遍历的到里面的信息。
for root, dirs, files in os.walk('out'):
print(root,dirs,files)
遍历后会得到三个不同的内容:
root
:文件夹的的绝对路径;
dirs
:文件夹下的所有子文件夹的名称
files
:文件夹下的所有文件的文件名,并保存到list中
二、获取指定格式的文件名称
如果想要获取指定格式的文件名称,我们需要对文件名称的后缀进行判断,os
模块中os.path.splitext(file)[1]
的结果即为文件的后缀,判断后进行添加即可。最终代码如下:
import os
import pandas as pd
def file_name(file_dir,name):
L = []
for root, dirs, files in os.walk(file_dir):
for file in files:
if os.path.splitext(file)[1] == '.csv' or os.path.splitext(
file)[1] == '.xlsx' or os.path.splitext(file)[1] == '.txt':
# 这种方式不带后缀,想要带有后缀将append中join的内容改成file即可
L.append(os.path.join(os.path.splitext(file)[0]))
re = pd.DataFrame(L)
re.to_excel('%s.xlsx' %name)
# 填入文件夹路径和名称即可
file_name('xxx','name')