我有一个包含文本的CSV列数据.每行用双引号分隔“ 一行中的示例文本与此类似(注意:新行和每行之前的空格) "Lorem ipsum dolor sit amet, consectetur adipisicing eli…
标签:python regex
用Python抓取RSS feed
我是 Python和编程的新手,所以如果问题非常愚蠢,请原谅. 我一直在跟踪this关于RSS抓取的教程,但是当我试图收集相应链接到正在收集的文章的标题时,我得到了Python的“列表索引超出范围”错误. 这是我的代码:…
python – 元音序列计数
这不是一个家庭作业问题,而是一个考试准备问题. 我应该定义一个功能音节(单词)来计算音节的数量用以下方式说一句话: •最大元音序列是一个音节; •单词中的最后一个不是音节(或者是元音序列,它是一个部分的). 我不需要处理…
python – 正则表达式re.findall()
我有一个函数,它接受计数和字符串作为输入.它应返回该长度计数字符串中所有单词的列表,并且更大.但是, Python无法识别我的变量并返回一个空列表. def word_number(count, string): ret…
Python:使用正则表达式捕获模式中的子模式
免责声明:这是我的第一篇文章.随意给我反馈,以及我应该或不应该格式化这个问题.谢谢! 我希望通过捕获匹配日期格式模式后跟冒号的任何内容来从文本块中提取数据.我已成功使用正则表达式来捕获信息,包括观察日期,冒号以及在下一个…
python:正则表达式匹配文件扩展名
您好我正在尝试获取在URL中调用的文件的扩展名(例如/wp-includes/js/ jquery/ jquery.js?ver=1.3.2 HTTP / 1.1)并获取传递给该文件的查询参数. 什么是扩展的最佳方式? …
使用正则表达式python获取模式后的句子
在我的字符串中(从 this turorial开始采用的例子)我希望获得所有内容,直到第一个.在通用(年)之后.图案: str = 'purple alice@google.com, (2002).blah monkey…
python – 组合三个正则表达式
有没有办法将以下三个表达式合并为一个正则表达式? name = re.sub(r'\s?\(\w+\)', '',name) # John Smith (ii) --> John Smith name = re.s…
使用Python将日记文件拆分为多个文件
我保留了技术说明的日记文件.每个条目都加上时间戳,如下所示: # Monday 02012-05-07 at 01:45:20 PM This is a sample note Lorem ipsum dolor sit…
Python – 正则表达式搜索以给定文本开头和结尾的字符串
我有一个文件列表,我想只保留以’test_’开头并以’.py’结尾的文件.我希望正则表达式只返回’test_’和’.py’中的文本.我不想要包含.pyc文件. 我试过了: >>>filename = '…
Python:正则表达式无法正常工作
我正在使用以下正则表达式,它假设找到字符串’U.S.A.’,但它只获得’A’,是否有人知道什么是错的? #INPUT import re text = 'That U.S.A. poster-print costs $1…
python – 拆分转义分隔符
编辑: 重新提出问题以便更好地理解. 对于我正在使用霍夫曼压缩的项目,我需要序列化我的霍夫曼树. 以下文字 “bought tickets to ride down a giant spiraling water sli…