前言
无论是哪一门语言,我们总会用到正则表达式来进行字符串的查找和替换。Java中也不为过,我曾经写过一个网页—正则表达式在线测试。那时候,我还没有开始学习Java,不知道Java支持正则表达式,所以我的第一个方案是想办法将数据传输到后台,然后利用Shell脚本正则表达式得到匹配结果。如果后来真的那么做了,那就二了。后来我研究了以下别的类似的网站,发现甚至连js文件都不用写,直接将函数写在html文件中就能够完成这一个任务。一天的时间,我把这个网站给写了出来。所以,即使不是脚本型语言,了解以下正则表达式总是有好处的。不过,本文不会赘述那些正则表达式的语法,不清楚的同学可以直接去API文档里面查查看。本文主要介绍用用Pattern类和Matcher类中用于查找和替换的一些方法,因为这些方法之间很容易混淆,所以分享一下,欢迎拍砖。
基本用法
Pattern类和Matcher类使用的基本流程:1.导入java.util.regex包;2.根据你的string生成一个Pattern对象引用,例如string str = “abc+”, Pattern p = Pattern.compile(str);3.调用Pattern的matcher方法,传入带匹配的字符串,生成Matcher对象引用;4.调用matcher类的诸多方法去实现查找和替换等功能。如下例所示:
import java.util.regex.*;
public class TestRegularExpression {
public static void main(String[] args) {
String strCharSequence = "abcabcabcdefabc";
String strRegex = "(abc)+";
Pattern p = Pattern.compile(strRegex);
Matcher m = p.matcher(strCharSequence);
while(m.find()) {
<span style="white-space:pre"> </span>System.out.println("Match \"" + m.group() + "\" at positions " +
m.start() + "-" + (m.end() - 1));
}
}
}
输出结果:
Match "abcabcabc" at positions 0-8
Match "abc" at positions 12-14
程序说明:这个程序在字符串abcabcabcdefabc通过正则表达式(abc)+进行匹配。并且利用了matcher.find()函数进行查找,现在就只需要知道find()函数能进行多次匹配就好了,matcher.group()方法能返回匹配的整个匹配结果,start()函数返回匹配位置的起始索引,end()方法返回所匹配的最后字符加1的值。下面我们详细地介绍一下有关于查找的几个常用的方法matches,lookingAt和find的区别。
查找
- matches()方法用来用来判断整个字符串是否匹配正则表达式,只有全部都匹配的时候才会返回true,否则返回false。但如果是部分匹配的话,则会移动匹配的开始的位置;
- lookingAt()方法部分匹配,总是从第一个字符进行匹配,匹配成功了不再继续匹配,匹配失败了,也不继续匹配;
- find()方法,部分匹配,从当前位置开始匹配,找到一个匹配的子串,将移动下次匹配的位置;
- reset()方法,将当前开始匹配的位置重新设置到左边最开始的位置。
可以结合下面的例子进行理解。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class IOTest {
public static void main(String[] args){
Pattern pattern = Pattern.compile("\\d{3,5}");
String charSequence = "123-34345-234-00";
Matcher matcher = pattern.matcher(charSequence);
//虽然匹配失败,但由于charSequence里面的"123"和pattern是匹配的,所以下次的匹配从位置4开始
print(matcher.matches());
//测试匹配位置
matcher.find();
print(matcher.start());
//使用reset方法重置匹配位置
matcher.reset();
//第一次find匹配以及匹配的目标和匹配的起始位置
print(matcher.find());
print(matcher.group()+" - "+matcher.start());
//第二次find匹配以及匹配的目标和匹配的起始位置
print(matcher.find());
print(matcher.group()+" - "+matcher.start());
//第一次lookingAt匹配以及匹配的目标和匹配的起始位置
print(matcher.lookingAt());
print(matcher.group()+" - "+matcher.start());
//第二次lookingAt匹配以及匹配的目标和匹配的起始位置
print(matcher.lookingAt());
print(matcher.group()+" - "+matcher.start());
}
public static void print(Object o){
System.out.println(o);
}
}
输出结果:
false
4
true
123 - 0
true
34345 - 4
true
123 - 0
true
123 - 0
替换
查找总是和替换结合在一起的,ctrl+f和ctrl+p就像麦当劳和肯德基吧,O(∩_∩)O哈哈~。matcher里卖弄提供了replaceFirst、replaceAll、appendReplacement以及appendTail方法来进行替换有关的操作,下面我们我们就介绍一下这几个方法的区别。
- replaceFirst()只替换匹配到的第一个地方;
- replaceAll()替换所有匹配到的地方;
- appendReplacement()将替换位置处及之前位置处的字符复制到StringBuffer中;
- appendTail()将替换位置之后的字符复制到StringBuffer
见下面的例子就明白了。
//: strings/TheReplacements.java
import java.util.regex.*;
public class TheReplacements {
private static final String CONSTSTRING = "fat cat, fat cat, fat cat, I like.";
public static void main(String[] args) throws Exception {
Pattern p = Pattern.compile("cat");
Matcher m = p.matcher(CONSTSTRING);
//replaceFirst()只替换匹配到的第一个地方
System.out.println(m.replaceFirst("dog"));
//replaceAll()替换所有匹配到的地方
p = Pattern.compile("cat");
m = p.matcher(CONSTSTRING);
System.out.println(m.replaceAll("dog"));
//appendReplacement()将替换位置处及之前位置处的字符复制到StringBuffer中;
//appendTail()将替换位置之后的字符复制到StringBuffer
p = Pattern.compile("cat");
m = p.matcher(CONSTSTRING);
StringBuffer sb = new StringBuffer();
while (m.find()) {
m.appendReplacement(sb, "dog");
System.out.println(sb.toString());
}
m.appendTail(sb);
System.out.println(sb.toString());
}
}
输出结果:
fat dog, fat cat, fat cat, I like.
fat dog, fat dog, fat dog, I like.
fat dog
fat dog, fat dog
fat dog, fat dog, fat dog
fat dog, fat dog, fat dog, I like.