正则表达式基础知识,延续更新……

基础内容

定义

正则形貌了一种字符串的婚配的情势 ,能够用来搜检一个字符串是不是包含某个子串或许是替换某个子串;平经常使用于表单考证,数据过滤,花样搜检,数据收集,数据隐蔽.

元字符

所谓元字符是用来申明婚配范例的,比方

.婚配换行符以外的恣意字符
w word婚配数字,字母,下划线,汉字
s space婚配恣意的空缺符
d digital婚配0-9之间数字
b border婚配单词的最先或完毕 作为边境
^婚配字符串的最先,以XX开首
^在[]内里示意否认,除了[]以外的
$婚配字符串的末端,以XX末端

限定符

划定紧接着的婚配的数目,与全局婚配global不一样,这里的是单个

*反复零次或更多
+反复一次或更多
?反复零次或一次
{n}反复n次
{n,}反复n次或更多
{n,m}反复n-m次
\转义字符,婚配须要的元字符

处置惩罚选项

i ignoreCase疏忽大小写
m multiline多行婚配
g global全局婚配
lastIndex当前表达式婚配内容的末了一个字符串的下一个位置
source正则的文本字符串

以上代码演示

var str='cat ,greatacatbat cat'
        console.log(str.replace(/(\bcat\b)/g,'*'))//* ,greatacatbat *

var str='123abc'
        console.log(str.replace(/\d?/,'*'))       // *23abc
        console.log(str.replace(/\d+/,'*'))       // *abc
        console.log(str.replace(/\d{2,3}/,'*'))   // *abc

贪欲和懒散

看上面的代码可知,限定符老是尽量多的婚配,我们称之为贪欲 ,然则有时候不须要这么贪欲,反而须要的是懒散,也就是尽少的婚配,那末?即可示意

*?反复恣意次,但尽少婚配
+?反复起码一次,但尽少婚配
??反复0或1次,但尽少婚配
{n,m}?反复n-m次,但尽少婚配
{n,}?反复最少n次,但尽少婚配

字符类

婚配自身划定的字符,平经常使用方括号[],[abcd]婚配abcd中恣意一个

如许前面的元字符可有[0-9]婚配d [a-zA-Z0-9]婚配w

分支前提 有时候不只是一种婚配划定规矩,比方电话号码,那末就须要| 把差别的划定规矩离开

0\d{2}-\d{8}|0\d{3}-\d{7} 婚配的就是两种差别的电话号码

反义

所谓反义就是婚配除了以外的一切

W D S B与本来的相反
[^abcd]婚配除abcd以外的恣意字符

分组

反复单个字符直接加元字符;反复多个字符则须要用()括起来再加元字符

(\d{1,3}\.){3}婚配1-3为数字加点 反复3次

调解分组 每一个分组都能够用$数字示意,第一个即\$1 这是在replace中示意;在正则自身中则用数字

疏忽分组 ?: 用来疏忽组,本来的组就被疏忽了,数字也就变化了

正向前瞻 (?=d) 负向前瞻 (?!d) 展望火线是不是相符前提

   var data='2014-02-12'   
   console.log(data.replace(/(\d{4})-(\d{2})-(\d{2})/,'$3/$2/$1')) //  12/02/2014

   var number='123456789'
   console.log(number.replace(/(\d{3})(?=\d{3})/g,'$1,'))   // 123,456,789

   var str='foo foo bar'
   console.log(/(\w+)\s\1/.test(str))   //true    在正则自身顶用\数字示意分组

   var one='a1b1c1'
   console.log(one.replace(/[a-z]\d/g,'*'))   //***
   
   /?:(\d+)/  //疏忽此次分组

js中正则的运用属性

RegExp实例属性

这些属性基础没多大用,只是个属性罢了,都能在正则的字面量或组织函数中得出

global ignoreCase lastIndex multiline source

js中的RegExp对象

javascript经由过程内置对象RegExp支撑正则表达式两种要领实例化RegExp对象

字面量要领 var reg=/d/gim

组织函数要领 var reg=new RegExp(‘d’,’g’)

RegExp的实例要领

exec要领 返回包含第一个婚配项信息的数组(没有则null),返回效果有input属性(运用正则的字符串)和index属性(婚配项在字符串中位置);关于exec而言,没有设置g index一直为第一个婚配的,设置g index则会顺次从下一个最先;然则效果是一样的

        var text="mom and dad and child"
        var reg1=/mom( and dad( and child)?)?/gim
        var result1=reg1.exec(text)

        console.log(result1)    //["mom and dad and child", " and dad and child", " and child"]   index: 0  input: "mom and dad and child"
        console.log(result1.index)  //0
        console.log(result1.input)  //mom and dad and child
        console.log(result1[0])     //mom
        console.log(result1[1])     //and dad and child
        console.log(result1[2])     //and child

test()要领 返回布尔值,磨练字符串是不是与正则相婚配,常与if语句,表单考证连系

toString要领 返回正则字面量

toLocaleString()要领 返回正则字面量

valueOf要领 返回的是正则自身 typeof 则为Object

   var reg=/\d/
        console.log(reg.test('123'))       // true

        console.log(reg.toString())        // /\d/
        console.log(reg.toString().length) //4
        console.log(reg.toLocaleString())  // /\d/
        console.log(typeof reg.valueOf())  // object

与正则相干的string的要领

search要领 接收一个参数:正则或字符串 返回的是第一个的索引,没有则null

split要领 字符串切割为数组

replace要领 两个参数:第一个参数为字符串或正则;第二个参数为字符串或函数;函数接收三个参数,match婚配的字符串、index婚配项在字符串位置、origin原字符串

        var one='u3n12'
        console.log(one.search(/\d/))  //3
        console.log(one.split(''))   //[ "u", "3", "n", "1", "2"]
        console.log(one.replace(/\d/g,'*'))
        console.log(one.replace(/\d/g,function(match,index,origin){
                 return parseInt(match)+1    //u4n23
        }))

match要领 接收一个参数:正则或RegExp对象 返回的是一个婚配文本有关的数组,没有则null

有g时,则全局婚配,返回数组寄存字符串中一切婚配子串,没有input和index属性

没有g时,则非全局婚配,返回数组的第一个元素寄存的是婚配文本,其他元素寄存的是与正则的子表达式婚配的文本;数组两个对象属性,index和input,和正则的exec要领类似

        var one='u3n12'
        console.log(one.match(/\d/))    //["3"] index: 1, input: "u3n12"  
        console.log(one.match(/\d/g))   //["3", "1", "2"]
        var text="mom and dad and child"
        var reg1=/mom( and dad( and child)?)?/im
        var reg2=/mom( and dad( and child)?)?/gim
        console.log(text.match(reg1))  //["mom and dad and child", " and dad and child", " and         child"]  //index: 0 input: "mom and dad and child"
        console.log(text.match(reg2))  //["mom and dad and child"]

比较exec和match

exec是正则表达式的要领;match是字符串的要领;然则返回效果都是数组

当没有子串时

exec效果不受g影响,返回的数组为第一项婚配;match返回的效果受g影响,当没有g则返回第一项婚配,当有g则返回全部数组

当有子串时

exec返回效果不受g影响,返回的是多项数组;match返回效果受g影响,当没有g则返回多项数组,当有g则只返回全部数组

议论的两种状况
        var str='mom234mom45'
        var reg=/\w{3}/
        var reg2=/\w{3}/gim
        console.log(str.match(reg))   //["mom"]
        console.log(reg.exec(str))    //["mom"]
        console.log(str.match(reg2))  //["mom", "234", "mom"]
        console.log(reg2.exec(str))   //["mom"]

一些现实例子

将ab,cd,ef 字母颠倒

var name='ab,cd,ef'
        var name2=name.split(';')  //分为数组
        for(var i=0;i<name2.length;i++){
              name2[i]=name2[i].replace(/(\w)(\w)/,"$2$1")   //遍历颠倒
        }
     console.log(name2)  //ba,dc,fe

两个网站

正则可视化

正则入门三十分钟

经常使用的正则

一、校验数字的表达式
 1 数字:^[0-9]*$
 2 n位的数字:^\d{n}$
 3 最少n位的数字:^\d{n,}$
 4 m-n位的数字:^\d{m,n}$
 5 零和非零开首的数字:^(0|[1-9][0-9]*)$
 6 非零开首的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
 7 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
 8 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
 9 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
10 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
11 非零的正整数:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
12 非零的负整数:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
13 非负整数:^\d+$ 或 ^[1-9]\d*|0$
14 非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非负浮点数:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16 非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17 正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮点数:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

二、校验字符的表达式
 1 汉字:^[\u4e00-\u9fa5]{0,}$
 2 英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
 3 长度为3-20的一切字符:^.{3,20}$
 4 由26个英文字母构成的字符串:^[A-Za-z]+$
 5 由26个大写英文字母构成的字符串:^[A-Z]+$
 6 由26个小写英文字母构成的字符串:^[a-z]+$
 7 由数字和26个英文字母构成的字符串:^[A-Za-z0-9]+$
 8 由数字、26个英文字母或许下划线构成的字符串:^\w+$ 或 ^\w{3,20}$
 9 中文、英文、数字包含下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
10 中文、英文、数字但不包含下划线等标记:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11 能够输入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+
12 制止输入含有~的字符:[^~\x22]+

三、特别需求表达式
 1 Email地点:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
 2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
 3 InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
 4 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
 5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$ 
 6 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
 7 身份证号:
    15或18位身份证:^\d{15}|\d{18}$
    15位身份证:^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$
    18位身份证:^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$
 8 短身份证号码(数字、字母x末端):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
 9 帐号是不是正当(字母开首,许可5-16字节,许可字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 暗码(以字母开首,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
11 强暗码(必需包含大小写字母和数字的组合,不能运用特别字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$  
12 日期花样:^\d{4}-\d{1,2}-\d{1,2}
13 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$ 
15 钱的输入花样:
16    1.有四种钱的示意情势我们能够接收:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$ 
17    2.这示意恣意一个不以0开首的数字,然则,这也意味着一个字符"0"不经由过程,所以我们采纳下面的情势:^(0|[1-9][0-9]*)$ 
18    3.一个0或许一个不以0开首的数字.我们还能够许可开首有一个负号:^(0|-?[1-9][0-9]*)$ 
19    4.这示意一个0或许一个能够为负的开首不为0的数字.让用户以0开首好了.把负号的也去掉,由于钱总不能是负的吧.下面我们要加的是申明能够的小数部份:^[0-9]+(.[0-9]+)?$ 
20    5.必需申明的是,小数点背面最少应该有1位数,所以"10."是不经由过程的,然则 "10" 和 "10.2" 是经由过程的:^[0-9]+(.[0-9]{2})?$ 
21    6.如许我们划定小数点背面必需有两位,假如你以为太苛刻了,能够如许:^[0-9]+(.[0-9]{1,2})?$ 
22    7.如许就许可用户只写一名小数.下面我们该斟酌数字中的逗号了,我们能够如许:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$ 
23    8.1到3个数字,背面随着恣意个 逗号+3个数字,逗号成为可选,而不是必需:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$ 
24    备注:这就是终究效果了,别忘了"+"能够用"*"替换假如你以为空字符串也能够接收的话(新鲜,为何?)末了,别忘了在用函数时去掉去掉谁人反斜杠,平常的毛病都在这里
25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
26 中文字符的正则表达式:[\u4e00-\u9fa5]
27 双字节字符:[^\x00-\xff]    (包含汉字在内,能够用来盘算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
28 空缺行的正则表达式:\n\s*\r    (能够用来删除空缺行)
29 HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />    (网上撒布的版本太蹩脚,上面这个也仅仅能部份,关于庞杂的嵌套标记照旧无计可施)
30 首尾空缺字符的正则表达式:^\s*|\s*$或(^\s*)|(\s*$)    (能够用来删除行首行尾的空缺字符(包含空格、制表符、换页符等等),异常有效的表达式)
31 腾讯QQ号:[1-9][0-9]{4,}    (腾讯QQ号从10000最先)
32 中国邮政编码:[1-9]\d{5}(?!\d)    (中国邮政编码为6位数字)
33 IP地点:\d+\.\d+\.\d+\.\d+    (提取IP地点时有效)
    原文作者:double
    原文地址: https://segmentfault.com/a/1190000013796969
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞