Python正则表达式在字符串的开头和结尾提取子字符串

2023年1月26日 530次阅读

我正在寻找一个将所有内容提取到第一个的正则表达式. (句号)字符串,包括和之后的所有内容. (期)

例如：

my_file.10.4.5.6.csv
myfile2.56.3.9.txt

理想情况下,对这些字符串运行时的正则表达式将返回：

my_file.csv 
myfile2.txt

每次运行脚本时,文件中的数字标记都会不同,所以我基本上想要排除它.

以下打印出第一个字符串. (期)

print re.search("^[^.]*", data_file).group(0)

我遇到了麻烦,虽然它也返回了最后一个句点和后面的字符串.

很抱歉只是根据以下反馈和评论进行更新：

这确实需要是一个正则表达式.正则表达式将从配置文件传递到程序中.用户将无法访问源代码,因为它将被打包.
用户可能需要根据某些任意标准更改正则表达式,因此他们需要更新配置文件,而不是编辑应用程序并重新构建包.

谢谢

最佳答案我建议使用str.split而不是正则表达式.例如：

>>> data_file = 'my_file.10.4.5.6.csv'
>>> parts = data_file.split('.')
>>> print parts[0] + '.' + parts[-1]
my_file.csv

但是,如果你坚持正则表达式,这里有一种方法：

>>> print re.sub(r'\..*\.', '.', data_file)
my_file.csv