正则表达式
REGEXP对象
javascript通过内置对象Regexp支持正则表达式。
两种方法来创建Regexp对象。
1、字面量
var reg = /\b\d{4}\b/g;
// g 表示进行全局替换
2、构造函数
var reg = new RegExp('\\b\\d{4}\\b','g');
// 这里因为是字符串,需要对特殊字符进行转义
// 利用正则进行文本替换
var reg = new RegExp('\\bis\\b','g');
"what is this?".replace(reg, 'IS');
// "what IS this?"
修饰符
- g : global 全文搜索,如果不添加的话,搜索到第一个就匹配停止
- i : ignore case 忽略大小写,默认大小写敏感
- m : multiple lines 多行搜索
'He is a boy. Is he?'.replace(/\bis\b/g, '0');
// 'He 0 a boy. Is he?'
'He is a boy. Is he?'.replace(/\bis\b/gi, '0');
// 'He 0 a boy. 0 he?'
元字符
正则表达式中有着两种基本字符,原义文本字符
和 元字符
;
原义文本字符
: a b f r …
元字符
: 指有特殊含义的非字母字符 b t …
正则表达式中的特殊字符: * + ? $ ^ . | [] {} ()
字符类
- 我们可以使用 元字符
[]
来构造一个简单的类 - 所谓类,就是符合某一个特征的对象,是泛指。
-
[abc]
把a
b
c
归为一类,表达式可以匹配这类字符 - 使用
^
可以取反,创建反向类,表示匹配不符合的字符
'a1b3c342bb'.replace(/[abc]/g, 'X');
// "X1X3X342XX"
'a1b3c342bb'.replace(/[^abc]/g, 'X');
// "aXbXcXXXbb"
范围类
- 使用
[a-z]
来链接两个字符表示从a
到z
的任意字符; - [a-zA-Z0-9]
预定义类和边界
预定义类
* . [^\r\n] 除了回车换行之外的任意字符
* \d [0-9] 数字
* \D [^0-9] 非数字
* \s [\t\n\f\r\x0B] 空白符
* \S [^\t\n\f\r\x0B] 非空白符
* \w [0-9a-zA-Z_] 字母数字下划线
* \W [^0-9a-zA-Z_] 非字母数字下划线
边界
^ 开头
$ 结尾
b 单词边界
B 非单词边界
'@abc@ab@'.replace(/@./g, 'Q');
// "QbcQb@"
'@abc@ab@'.replace(/^@./g, 'Q');
// "Qbc@ab@"
'@abc@ab@'.replace(/.@$/g, 'Q');
// "@abc@aQ"
// 验证 m 表示多行搜索
var mulSrt="@123\n@456\n%890";
mulSrt.replace(/@\d/gm, 'X');
"X23
X56
%890"
量词
* ? 出现0次或者一次 0/1
* + 至少出现1次 >= 1
* * 出现零次或者一次 >= 0
* {n} 出现n次
* {n, m} 出现 n 到 m 次
* {n, } 至少出现n 次
贪婪模式和非贪婪模式
/\d{3,6}/
匹配 12345678 得到 123456
// 这就是贪婪模式
非贪婪模式
让正则表达式尽可能的少匹配,也就是说一旦匹配成功就不在继续尝试。[做法很简单,就是在量词后添加一个?即可]
/\d{3,5}?/g
分组
- ()分组
'a1b2c3d4'.replace(/[a-z]\d{3}/g, 'X');
// a1b2c3d4
'a1b2c3d4'.replace(/([a-z]\d){3}/g, 'X');
// Xd4
- 或 |
'meiaals'.replace(/[a-z]+(aa|bb)[a-z]+/g, '0');
// 0
'meibbls'.replace(/[a-z]+(aa|bb)[a-z]+/g, '0');
// 0
- 分组取值
'2016-04-23'.replace(/(\d{4})-(\d{2})-(\d{2})/, '$3-$2-$1');
// "23-04-2016"
前瞻
“正则表达式是从文本头部向尾部解析”。这就像在走路,没走过的路在你的前面,需要你往前看(前瞻);走过的路需要你回头看(后顾)
[js不支持后顾]
- 正向前瞻
exp(?=assert)
- 负向前瞻
exp(?!assert)
'a2*3'.replace(/\w(?=\d)/g, 'X');
// "X2*3"
对象属性
- global:是否全文搜索,默认false
- ignore case:是否大小写敏感,默认是false
- multiline:多行搜索,默认值是false
- lastIndex:当前表达式匹配内容的最后一个字符的下一个位置
- source:正则表达式的文本字符串
let regex = /(\d{4}\1)-(\d{2})-(\d{2})/g;
regex.source
// "(\d{4}\1)-(\d{2})-(\d{2})"
RegExp对象本身的方法
RegExp.prototype.test(str)
用户测试某一个字符串是否存在匹配正则表达式模式的字符串,如果存在就返回true 、 否则 返回 false。
var reg2=/\w/g;
进行reg2.test('ab')时,第三次会变成false
原因:
while(reg2.test('ab')){
console.log(reg2.lastIndex);
}
RegExp.prototype.exec(str)
如果没有匹配返回null,如果匹配成功,返回一个数组。(index: 匹配文本的第一个字符的位置,input: 存放被检索的字符串的string);
var reg = /\d(\w)(\w)\d/g;
var str = '$1ab343sdd5ef6';
var ret;
while(ret = reg.exec(str)) {
console.log(ret[0] +'-'+ret[1] +'-'+ret[2]);
console.log(ret.index);
}
// ["1ab3", "a", "b", index: 1, input: "$1ab343sdd5ef6", groups: undefined]
// ["5ef6", "e", "f", index: 10, input: "$1ab343sdd5ef6", groups: undefined]
// 第一个为匹配的字符串, 第二项之后都是分组内容
String对象本身的方法
String.prototype.search(reg)
用于检索字符串中指定的子字符串、或者检索于正则匹配的子字符串。返回一个index, 如果没有找到返回-1. [忽略g,并且每次都是从开头匹配];
'wwasdasf7'.search(/\d/);
// 8
String.prototype.match(reg)
match方法将检索字符串,以找到一个或者多个与regexp匹配的文本。
(是否有g影响很大)
- 如果找到了就返回一个数组,如果没有找到,返回null
var reg = /\d(\w)(\w)\d/g;
var str = '$1ab343sdd5ef6';
var ret = str.match(reg);
console.log(ret);
// ["1ab3", "5ef6"]
String.prototype.split(str/reg)
'a,d,f,g,h'.split(',');
// ["a", "d", "f", "g", "h"]
'a1b1c2d3f5'.split(/\d/g);
// ["a", "b", "c", "d", "f", ""]
String.prototype.replace(str, replacestr)
'asd231'.replace('2', 'S');
String.prototype.replace(reg, replacestr)
'asd231'.replace(/\d+/g, 'S');
String.prototype.replace(reg, function)
// a1b2c3d4 => z2b3c4d5
'a1b2c3d4'.replace(/\d/g, function(match, index, origin){
console.log(index);
return parseInt(match) + 1;
})
// "a2b3c4d5"