标签：regex

正则表达式 – 解析大文件时为什么Scala的组合器解析速度慢？我能做什么？

我需要解析拥有数百万行的文件.我注意到我的组合器解析器变得越来越慢,因为它解析了越来越多的行.问题似乎是在 scala的“rep”或正则表达式解析器中,因为即使对于下面显示的简单示例解析器,也会出现这种情况： def f…

我试图从除前20个字符之外的字符串中删除所有内容.但正则表达式删除前20个并保留其余部分.我怎么解决这个问题？这是我的代码： [% p.name | remove('(.{20})', '$1') %] 我也试过这个：…

我正在寻找一种能够找到与特定字符串匹配的所有模式的高效算法.模式集可以非常大(超过100,000)和动态(随时添加或删除模式).模式不一定是标准正则表达式,它们可以是正则表达式的子集或类似于 shell模式的东西(即：f…

参见英文答案 > Is the lazy version of the ‘optional’ quantifier (‘??’) ever useful in a regular expression? …

我使用正则表达式来计算pdf的页数.下面是我使用的代码. Regex regex = new Regex(@"/Type\s*/Page[^s]"); MatchCollection matches = regex.Ma…

我试图在两种模式之间过滤掉文本,我已经看过十几个例子,但没有设法得到我想要的东西：样本输入： START LEAVEMEBE text data START DELETEME text data more data e…

我想创建一个正则表达式来提取第一个斜杠之前的所有内容,除非它是单引号或双引号.目前,我有： ^(.*?)/ 现在,我迷失了.根据下面的不同文本,我只想要下面的粗体部分：文本 abc,def,ghi,jkl,mno / …

我需要动态获取我的.htaccess文件所在的当前目录.那可能吗？ (一个变量可能？). 类似于：％{SCRIPT_FILENAME} 先感谢您. 编辑：如果使用正则表达式？它应该怎么样？最佳答案实际上Apache…

题：我想在emacs中创建一个数字字体锁面,但是我无法获得符合我需要的正则表达式.这是我有的： "\\<\$[0-9]*\\.?[0-9]*\$+\$d\\|f\$?\\>" 我想要它匹配： &…

我试图从字符串中删除撇号和双引号,并注意到有各种版本创建到我正在使用的数据,具体取决于它的创建方式.例如,Word文档倾向于使用这些： It’s raining again. What do you mean by “w…

我有一个查询从db中选择类似的实体. Query query = entityManager.createQuery("select c from Case c where c.lastName = :lastName"…

我想清理@media和}之间的所有内容.只有经过研究,我仍然无法找到.我想替换下面BOLD文本之间的所有内容,包括BOLD文本本身： @media all and (max-width: 240px) { #toast-…