基础内容
定义
正则形貌了一种字符串的婚配的情势 ,能够用来搜检一个字符串是不是包含某个子串或许是替换某个子串;平经常使用于表单考证,数据过滤,花样搜检,数据收集,数据隐蔽.
元字符
所谓元字符是用来申明婚配范例的,比方
. | 婚配换行符以外的恣意字符 |
---|---|
w word | 婚配数字,字母,下划线,汉字 |
s space | 婚配恣意的空缺符 |
d digital | 婚配0-9之间数字 |
b border | 婚配单词的最先或完毕 作为边境 |
^ | 婚配字符串的最先,以XX开首 |
^在[]内里示意否认,除了[]以外的 | |
$ | 婚配字符串的末端,以XX末端 |
限定符
划定紧接着的婚配的数目,与全局婚配global不一样,这里的是单个
* | 反复零次或更多 |
---|---|
+ | 反复一次或更多 |
? | 反复零次或一次 |
{n} | 反复n次 |
{n,} | 反复n次或更多 |
{n,m} | 反复n-m次 |
\ | 转义字符,婚配须要的元字符 |
处置惩罚选项
i ignoreCase | 疏忽大小写 |
---|---|
m multiline | 多行婚配 |
g global | 全局婚配 |
lastIndex | 当前表达式婚配内容的末了一个字符串的下一个位置 |
source | 正则的文本字符串 |
以上代码演示
var str='cat ,greatacatbat cat'
console.log(str.replace(/(\bcat\b)/g,'*'))//* ,greatacatbat *
var str='123abc'
console.log(str.replace(/\d?/,'*')) // *23abc
console.log(str.replace(/\d+/,'*')) // *abc
console.log(str.replace(/\d{2,3}/,'*')) // *abc
贪欲和懒散
看上面的代码可知,限定符老是尽量多的婚配,我们称之为贪欲 ,然则有时候不须要这么贪欲,反而须要的是懒散,也就是尽少的婚配,那末?即可示意
*? | 反复恣意次,但尽少婚配 |
---|---|
+? | 反复起码一次,但尽少婚配 |
?? | 反复0或1次,但尽少婚配 |
{n,m}? | 反复n-m次,但尽少婚配 |
{n,}? | 反复最少n次,但尽少婚配 |
字符类
婚配自身划定的字符,平经常使用方括号[],[abcd]婚配abcd中恣意一个
如许前面的元字符可有[0-9]婚配d [a-zA-Z0-9]婚配w
分支前提 有时候不只是一种婚配划定规矩,比方电话号码,那末就须要| 把差别的划定规矩离开
0\d{2}-\d{8}|0\d{3}-\d{7}
婚配的就是两种差别的电话号码
反义
所谓反义就是婚配除了以外的一切
W D S B | 与本来的相反 |
---|---|
[^abcd] | 婚配除abcd以外的恣意字符 |
分组
反复单个字符直接加元字符;反复多个字符则须要用()括起来再加元字符
(\d{1,3}\.){3}
婚配1-3为数字加点 反复3次
调解分组 每一个分组都能够用$数字示意,第一个即\$1 这是在replace中示意;在正则自身中则用数字
疏忽分组 ?: 用来疏忽组,本来的组就被疏忽了,数字也就变化了
正向前瞻 (?=d) 负向前瞻 (?!d) 展望火线是不是相符前提
var data='2014-02-12'
console.log(data.replace(/(\d{4})-(\d{2})-(\d{2})/,'$3/$2/$1')) // 12/02/2014
var number='123456789'
console.log(number.replace(/(\d{3})(?=\d{3})/g,'$1,')) // 123,456,789
var str='foo foo bar'
console.log(/(\w+)\s\1/.test(str)) //true 在正则自身顶用\数字示意分组
var one='a1b1c1'
console.log(one.replace(/[a-z]\d/g,'*')) //***
/?:(\d+)/ //疏忽此次分组
js中正则的运用属性
RegExp实例属性
这些属性基础没多大用,只是个属性罢了,都能在正则的字面量或组织函数中得出
global ignoreCase lastIndex multiline source
js中的RegExp对象
javascript经由过程内置对象RegExp支撑正则表达式两种要领实例化RegExp对象
字面量要领 var reg=/d/gim
组织函数要领 var reg=new RegExp(‘d’,’g’)
RegExp的实例要领
exec要领 返回包含第一个婚配项信息的数组(没有则null),返回效果有input属性(运用正则的字符串)和index属性(婚配项在字符串中位置);关于exec而言,没有设置g index一直为第一个婚配的,设置g index则会顺次从下一个最先;然则效果是一样的
var text="mom and dad and child"
var reg1=/mom( and dad( and child)?)?/gim
var result1=reg1.exec(text)
console.log(result1) //["mom and dad and child", " and dad and child", " and child"] index: 0 input: "mom and dad and child"
console.log(result1.index) //0
console.log(result1.input) //mom and dad and child
console.log(result1[0]) //mom
console.log(result1[1]) //and dad and child
console.log(result1[2]) //and child
test()要领 返回布尔值,磨练字符串是不是与正则相婚配,常与if语句,表单考证连系
toString要领 返回正则字面量
toLocaleString()要领 返回正则字面量
valueOf要领 返回的是正则自身 typeof 则为Object
var reg=/\d/
console.log(reg.test('123')) // true
console.log(reg.toString()) // /\d/
console.log(reg.toString().length) //4
console.log(reg.toLocaleString()) // /\d/
console.log(typeof reg.valueOf()) // object
与正则相干的string的要领
search要领 接收一个参数:正则或字符串 返回的是第一个的索引,没有则null
split要领 字符串切割为数组
replace要领 两个参数:第一个参数为字符串或正则;第二个参数为字符串或函数;函数接收三个参数,match婚配的字符串、index婚配项在字符串位置、origin原字符串
var one='u3n12'
console.log(one.search(/\d/)) //3
console.log(one.split('')) //[ "u", "3", "n", "1", "2"]
console.log(one.replace(/\d/g,'*'))
console.log(one.replace(/\d/g,function(match,index,origin){
return parseInt(match)+1 //u4n23
}))
match要领 接收一个参数:正则或RegExp对象 返回的是一个婚配文本有关的数组,没有则null
有g时,则全局婚配,返回数组寄存字符串中一切婚配子串,没有input和index属性
没有g时,则非全局婚配,返回数组的第一个元素寄存的是婚配文本,其他元素寄存的是与正则的子表达式婚配的文本;数组两个对象属性,index和input,和正则的exec要领类似
var one='u3n12'
console.log(one.match(/\d/)) //["3"] index: 1, input: "u3n12"
console.log(one.match(/\d/g)) //["3", "1", "2"]
var text="mom and dad and child"
var reg1=/mom( and dad( and child)?)?/im
var reg2=/mom( and dad( and child)?)?/gim
console.log(text.match(reg1)) //["mom and dad and child", " and dad and child", " and child"] //index: 0 input: "mom and dad and child"
console.log(text.match(reg2)) //["mom and dad and child"]
比较exec和match
exec是正则表达式的要领;match是字符串的要领;然则返回效果都是数组
当没有子串时
exec效果不受g影响,返回的数组为第一项婚配;match返回的效果受g影响,当没有g则返回第一项婚配,当有g则返回全部数组
当有子串时
exec返回效果不受g影响,返回的是多项数组;match返回效果受g影响,当没有g则返回多项数组,当有g则只返回全部数组
议论的两种状况
var str='mom234mom45'
var reg=/\w{3}/
var reg2=/\w{3}/gim
console.log(str.match(reg)) //["mom"]
console.log(reg.exec(str)) //["mom"]
console.log(str.match(reg2)) //["mom", "234", "mom"]
console.log(reg2.exec(str)) //["mom"]
一些现实例子
将ab,cd,ef 字母颠倒
var name='ab,cd,ef'
var name2=name.split(';') //分为数组
for(var i=0;i<name2.length;i++){
name2[i]=name2[i].replace(/(\w)(\w)/,"$2$1") //遍历颠倒
}
console.log(name2) //ba,dc,fe
两个网站
经常使用的正则
一、校验数字的表达式
1 数字:^[0-9]*$
2 n位的数字:^\d{n}$
3 最少n位的数字:^\d{n,}$
4 m-n位的数字:^\d{m,n}$
5 零和非零开首的数字:^(0|[1-9][0-9]*)$
6 非零开首的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
8 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
9 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
10 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
11 非零的正整数:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
12 非零的负整数:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
13 非负整数:^\d+$ 或 ^[1-9]\d*|0$
14 非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非负浮点数:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16 非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17 正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮点数:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
二、校验字符的表达式
1 汉字:^[\u4e00-\u9fa5]{0,}$
2 英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 长度为3-20的一切字符:^.{3,20}$
4 由26个英文字母构成的字符串:^[A-Za-z]+$
5 由26个大写英文字母构成的字符串:^[A-Z]+$
6 由26个小写英文字母构成的字符串:^[a-z]+$
7 由数字和26个英文字母构成的字符串:^[A-Za-z0-9]+$
8 由数字、26个英文字母或许下划线构成的字符串:^\w+$ 或 ^\w{3,20}$
9 中文、英文、数字包含下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
10 中文、英文、数字但不包含下划线等标记:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11 能够输入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+
12 制止输入含有~的字符:[^~\x22]+
三、特别需求表达式
1 Email地点:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
4 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
7 身份证号:
15或18位身份证:^\d{15}|\d{18}$
15位身份证:^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$
18位身份证:^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$
8 短身份证号码(数字、字母x末端):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 帐号是不是正当(字母开首,许可5-16字节,许可字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 暗码(以字母开首,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
11 强暗码(必需包含大小写字母和数字的组合,不能运用特别字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12 日期花样:^\d{4}-\d{1,2}-\d{1,2}
13 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
15 钱的输入花样:
16 1.有四种钱的示意情势我们能够接收:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
17 2.这示意恣意一个不以0开首的数字,然则,这也意味着一个字符"0"不经由过程,所以我们采纳下面的情势:^(0|[1-9][0-9]*)$
18 3.一个0或许一个不以0开首的数字.我们还能够许可开首有一个负号:^(0|-?[1-9][0-9]*)$
19 4.这示意一个0或许一个能够为负的开首不为0的数字.让用户以0开首好了.把负号的也去掉,由于钱总不能是负的吧.下面我们要加的是申明能够的小数部份:^[0-9]+(.[0-9]+)?$
20 5.必需申明的是,小数点背面最少应该有1位数,所以"10."是不经由过程的,然则 "10" 和 "10.2" 是经由过程的:^[0-9]+(.[0-9]{2})?$
21 6.如许我们划定小数点背面必需有两位,假如你以为太苛刻了,能够如许:^[0-9]+(.[0-9]{1,2})?$
22 7.如许就许可用户只写一名小数.下面我们该斟酌数字中的逗号了,我们能够如许:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
23 8.1到3个数字,背面随着恣意个 逗号+3个数字,逗号成为可选,而不是必需:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
24 备注:这就是终究效果了,别忘了"+"能够用"*"替换假如你以为空字符串也能够接收的话(新鲜,为何?)末了,别忘了在用函数时去掉去掉谁人反斜杠,平常的毛病都在这里
25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
26 中文字符的正则表达式:[\u4e00-\u9fa5]
27 双字节字符:[^\x00-\xff] (包含汉字在内,能够用来盘算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
28 空缺行的正则表达式:\n\s*\r (能够用来删除空缺行)
29 HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? /> (网上撒布的版本太蹩脚,上面这个也仅仅能部份,关于庞杂的嵌套标记照旧无计可施)
30 首尾空缺字符的正则表达式:^\s*|\s*$或(^\s*)|(\s*$) (能够用来删除行首行尾的空缺字符(包含空格、制表符、换页符等等),异常有效的表达式)
31 腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000最先)
32 中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
33 IP地点:\d+\.\d+\.\d+\.\d+ (提取IP地点时有效)