场景:
在工作中有的时候我们会遇到这样的场景,在网上下载下来的资料总是有一些我们不想要的内容。
此时我们怎么批量删除他们呢?
import re,os
filePath = r"C:\Users\Administrator\Desktop\StudyNotes"
fileList = os.listdir(filePath)
delInfo = r"<a(.*)</a>"
temp_name = r"C:\Users\Administrator\Desktop\StudyNotes\temp.md"
for md_file in fileList:
fileName = filePath + "\\" + md_file
try:
with open(fileName,'r',encoding='utf-8') as f1,open(temp_name,'w',encoding='utf-8') as f2:
data = f1.read()
data = re.sub(delInfo,"",data)
f2.write(data)
os.remove(fileName)
os.rename(temp_name,fileName)
except Exception:
pass
这样我们就把以”<a”开头以””结尾的文本删除了。如果又不懂的可以评论,楼主天天都会看C站,看到了都会及时回复哟~