我正在寻找一个将所有内容提取到第一个的正则表达式. (句号)字符串,包括和之后的所有内容. (期)
例如:
my_file.10.4.5.6.csv
myfile2.56.3.9.txt
理想情况下,对这些字符串运行时的正则表达式将返回:
my_file.csv
myfile2.txt
每次运行脚本时,文件中的数字标记都会不同,所以我基本上想要排除它.
以下打印出第一个字符串. (期)
print re.search("^[^.]*", data_file).group(0)
我遇到了麻烦,虽然它也返回了最后一个句点和后面的字符串.
很抱歉只是根据以下反馈和评论进行更新:
这确实需要是一个正则表达式.正则表达式将从配置文件传递到程序中.用户将无法访问源代码,因为它将被打包.
用户可能需要根据某些任意标准更改正则表达式,因此他们需要更新配置文件,而不是编辑应用程序并重新构建包.
谢谢
最佳答案 我建议使用str.split而不是正则表达式.例如:
>>> data_file = 'my_file.10.4.5.6.csv'
>>> parts = data_file.split('.')
>>> print parts[0] + '.' + parts[-1]
my_file.csv
但是,如果你坚持正则表达式,这里有一种方法:
>>> print re.sub(r'\..*\.', '.', data_file)
my_file.csv