正则表达式基础知识，延续更新……

2024年4月19日 182次阅读来源: double

基础内容

定义

正则形貌了一种字符串的婚配的情势 ,能够用来搜检一个字符串是不是包含某个子串或许是替换某个子串;平经常使用于表单考证,数据过滤,花样搜检,数据收集,数据隐蔽.

元字符

所谓元字符是用来申明婚配范例的,比方

.	婚配换行符以外的恣意字符
w word	婚配数字，字母，下划线，汉字
s space	婚配恣意的空缺符
d digital	婚配0-9之间数字
b border	婚配单词的最先或完毕作为边境
^	婚配字符串的最先，以XX开首
	^在[]内里示意否认，除了[]以外的
$	婚配字符串的末端，以XX末端

限定符

划定紧接着的婚配的数目，与全局婚配global不一样，这里的是单个

*	反复零次或更多
+	反复一次或更多
?	反复零次或一次
{n}	反复n次
{n,}	反复n次或更多
{n,m}	反复n-m次
\	转义字符，婚配须要的元字符

处置惩罚选项

i ignoreCase	疏忽大小写
m multiline	多行婚配
g global	全局婚配
lastIndex	当前表达式婚配内容的末了一个字符串的下一个位置
source	正则的文本字符串

以上代码演示

var str='cat ,greatacatbat cat'
        console.log(str.replace(/(\bcat\b)/g,'*'))//* ,greatacatbat *

var str='123abc'
        console.log(str.replace(/\d?/,'*'))       // *23abc
        console.log(str.replace(/\d+/,'*'))       // *abc
        console.log(str.replace(/\d{2,3}/,'*'))   // *abc

贪欲和懒散

看上面的代码可知，限定符老是尽量多的婚配，我们称之为贪欲，然则有时候不须要这么贪欲，反而须要的是懒散，也就是尽少的婚配，那末？即可示意

*？	反复恣意次，但尽少婚配
+？	反复起码一次，但尽少婚配
??	反复0或1次，但尽少婚配
{n,m}?	反复n-m次，但尽少婚配
{n,}?	反复最少n次，但尽少婚配

字符类

婚配自身划定的字符，平经常使用方括号[]，[abcd]婚配abcd中恣意一个

如许前面的元字符可有[0-9]婚配d [a-zA-Z0-9]婚配w

分支前提 有时候不只是一种婚配划定规矩，比方电话号码，那末就须要| 把差别的划定规矩离开

0\d{2}-\d{8}|0\d{3}-\d{7} 婚配的就是两种差别的电话号码

反义

所谓反义就是婚配除了以外的一切

W D S B	与本来的相反
[^abcd]	婚配除abcd以外的恣意字符

分组

反复单个字符直接加元字符；反复多个字符则须要用()括起来再加元字符

(\d{1,3}\.){3}婚配1-3为数字加点反复3次

调解分组 每一个分组都能够用$数字示意，第一个即\$1 这是在replace中示意；在正则自身中则用数字

疏忽分组 ?: 用来疏忽组，本来的组就被疏忽了，数字也就变化了

正向前瞻 (?=d) 负向前瞻 (?!d) 展望火线是不是相符前提

   var data='2014-02-12'   
   console.log(data.replace(/(\d{4})-(\d{2})-(\d{2})/,'$3/$2/$1')) //  12/02/2014

   var number='123456789'
   console.log(number.replace(/(\d{3})(?=\d{3})/g,'$1,'))   // 123,456,789

   var str='foo foo bar'
   console.log(/(\w+)\s\1/.test(str))   //true    在正则自身顶用\数字示意分组

   var one='a1b1c1'
   console.log(one.replace(/[a-z]\d/g,'*'))   //***
   
   /?:(\d+)/  //疏忽此次分组

js中正则的运用属性

RegExp实例属性

这些属性基础没多大用，只是个属性罢了，都能在正则的字面量或组织函数中得出
global ignoreCase lastIndex multiline source

js中的RegExp对象

javascript经由过程内置对象RegExp支撑正则表达式两种要领实例化RegExp对象

字面量要领 var reg=/d/gim

组织函数要领 var reg=new RegExp(‘d’,’g’)

RegExp的实例要领

exec要领 返回包含第一个婚配项信息的数组(没有则null)，返回效果有input属性(运用正则的字符串)和index属性(婚配项在字符串中位置)；关于exec而言，没有设置g index一直为第一个婚配的，设置g index则会顺次从下一个最先；然则效果是一样的

        var text="mom and dad and child"
        var reg1=/mom( and dad( and child)?)?/gim
        var result1=reg1.exec(text)

        console.log(result1)    //["mom and dad and child", " and dad and child", " and child"]   index: 0  input: "mom and dad and child"
        console.log(result1.index)  //0
        console.log(result1.input)  //mom and dad and child
        console.log(result1[0])     //mom
        console.log(result1[1])     //and dad and child
        console.log(result1[2])     //and child

test()要领 返回布尔值，磨练字符串是不是与正则相婚配，常与if语句，表单考证连系

toString要领 返回正则字面量

toLocaleString()要领 返回正则字面量

valueOf要领 返回的是正则自身 typeof 则为Object

   var reg=/\d/
        console.log(reg.test('123'))       // true

        console.log(reg.toString())        // /\d/
        console.log(reg.toString().length) //4
        console.log(reg.toLocaleString())  // /\d/
        console.log(typeof reg.valueOf())  // object

与正则相干的string的要领

search要领 接收一个参数：正则或字符串返回的是第一个的索引，没有则null

split要领 字符串切割为数组

replace要领 两个参数：第一个参数为字符串或正则；第二个参数为字符串或函数；函数接收三个参数，match婚配的字符串、index婚配项在字符串位置、origin原字符串

        var one='u3n12'
        console.log(one.search(/\d/))  //3
        console.log(one.split(''))   //[ "u", "3", "n", "1", "2"]
        console.log(one.replace(/\d/g,'*'))
        console.log(one.replace(/\d/g,function(match,index,origin){
                 return parseInt(match)+1    //u4n23
        }))

match要领 接收一个参数：正则或RegExp对象返回的是一个婚配文本有关的数组，没有则null

有g时，则全局婚配，返回数组寄存字符串中一切婚配子串，没有input和index属性

没有g时，则非全局婚配，返回数组的第一个元素寄存的是婚配文本，其他元素寄存的是与正则的子表达式婚配的文本；数组两个对象属性，index和input，和正则的exec要领类似

        var one='u3n12'
        console.log(one.match(/\d/))    //["3"] index: 1, input: "u3n12"  
        console.log(one.match(/\d/g))   //["3", "1", "2"]

        var text="mom and dad and child"
        var reg1=/mom( and dad( and child)?)?/im
        var reg2=/mom( and dad( and child)?)?/gim
        console.log(text.match(reg1))  //["mom and dad and child", " and dad and child", " and         child"]  //index: 0 input: "mom and dad and child"
        console.log(text.match(reg2))  //["mom and dad and child"]

比较exec和match

exec是正则表达式的要领；match是字符串的要领；然则返回效果都是数组

当没有子串时

exec效果不受g影响，返回的数组为第一项婚配；match返回的效果受g影响，当没有g则返回第一项婚配，当有g则返回全部数组

当有子串时

exec返回效果不受g影响，返回的是多项数组；match返回效果受g影响，当没有g则返回多项数组，当有g则只返回全部数组

议论的两种状况
        var str='mom234mom45'
        var reg=/\w{3}/
        var reg2=/\w{3}/gim
        console.log(str.match(reg))   //["mom"]
        console.log(reg.exec(str))    //["mom"]
        console.log(str.match(reg2))  //["mom", "234", "mom"]
        console.log(reg2.exec(str))   //["mom"]

一些现实例子

将ab,cd,ef 字母颠倒

var name='ab,cd,ef'
        var name2=name.split(';')  //分为数组
        for(var i=0;i<name2.length;i++){
              name2[i]=name2[i].replace(/(\w)(\w)/,"$2$1")   //遍历颠倒
        }
     console.log(name2)  //ba,dc,fe

两个网站

正则可视化
正则入门三十分钟

经常使用的正则

一、校验数字的表达式
 1 数字：^[0-9]*$
 2 n位的数字：^\d{n}$
 3 最少n位的数字：^\d{n,}$
 4 m-n位的数字：^\d{m,n}$
 5 零和非零开首的数字：^(0|[1-9][0-9]*)$
 6 非零开首的最多带两位小数的数字：^([1-9][0-9]*)+(.[0-9]{1,2})?$
 7 带1-2位小数的正数或负数：^(\-)?\d+(\.\d{1,2})?$
 8 正数、负数、和小数：^(\-|\+)?\d+(\.\d+)?$
 9 有两位小数的正实数：^[0-9]+(.[0-9]{2})?$
10 有1~3位小数的正实数：^[0-9]+(.[0-9]{1,3})?$
11 非零的正整数：^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
12 非零的负整数：^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
13 非负整数：^\d+$ 或 ^[1-9]\d*|0$
14 非正整数：^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非负浮点数：^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16 非正浮点数：^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17 正浮点数：^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 负浮点数：^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮点数：^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

二、校验字符的表达式
 1 汉字：^[\u4e00-\u9fa5]{0,}$
 2 英文和数字：^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
 3 长度为3-20的一切字符：^.{3,20}$
 4 由26个英文字母构成的字符串：^[A-Za-z]+$
 5 由26个大写英文字母构成的字符串：^[A-Z]+$
 6 由26个小写英文字母构成的字符串：^[a-z]+$
 7 由数字和26个英文字母构成的字符串：^[A-Za-z0-9]+$
 8 由数字、26个英文字母或许下划线构成的字符串：^\w+$ 或 ^\w{3,20}$
 9 中文、英文、数字包含下划线：^[\u4E00-\u9FA5A-Za-z0-9_]+$
10 中文、英文、数字但不包含下划线等标记：^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11 能够输入含有^%&',;=?$\"等字符：[^%&',;=?$\x22]+
12 制止输入含有~的字符：[^~\x22]+

三、特别需求表达式
 1 Email地点：^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
 2 域名：[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
 3 InternetURL：[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
 4 手机号码：^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
 5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX)：^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$ 
 6 国内电话号码(0511-4405222、021-87888822)：\d{3}-\d{8}|\d{4}-\d{7}
 7 身份证号：
    15或18位身份证：^\d{15}|\d{18}$
    15位身份证：^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$
    18位身份证：^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$
 8 短身份证号码(数字、字母x末端)：^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
 9 帐号是不是正当(字母开首，许可5-16字节，许可字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 暗码(以字母开首，长度在6~18之间，只能包含字母、数字和下划线)：^[a-zA-Z]\w{5,17}$
11 强暗码(必需包含大小写字母和数字的组合，不能运用特别字符，长度在8-10之间)：^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$  
12 日期花样：^\d{4}-\d{1,2}-\d{1,2}
13 一年的12个月(01～09和1～12)：^(0?[1-9]|1[0-2])$
14 一个月的31天(01～09和1～31)：^((0?[1-9])|((1|2)[0-9])|30|31)$ 
15 钱的输入花样：
16    1.有四种钱的示意情势我们能够接收:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000"：^[1-9][0-9]*$ 
17    2.这示意恣意一个不以0开首的数字,然则,这也意味着一个字符"0"不经由过程,所以我们采纳下面的情势：^(0|[1-9][0-9]*)$ 
18    3.一个0或许一个不以0开首的数字.我们还能够许可开首有一个负号：^(0|-?[1-9][0-9]*)$ 
19    4.这示意一个0或许一个能够为负的开首不为0的数字.让用户以0开首好了.把负号的也去掉,由于钱总不能是负的吧.下面我们要加的是申明能够的小数部份：^[0-9]+(.[0-9]+)?$ 
20    5.必需申明的是,小数点背面最少应该有1位数,所以"10."是不经由过程的,然则 "10" 和 "10.2" 是经由过程的：^[0-9]+(.[0-9]{2})?$ 
21    6.如许我们划定小数点背面必需有两位,假如你以为太苛刻了,能够如许：^[0-9]+(.[0-9]{1,2})?$ 
22    7.如许就许可用户只写一名小数.下面我们该斟酌数字中的逗号了,我们能够如许：^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$ 
23    8.1到3个数字,背面随着恣意个 逗号+3个数字,逗号成为可选,而不是必需：^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$ 
24    备注：这就是终究效果了,别忘了"+"能够用"*"替换假如你以为空字符串也能够接收的话(新鲜,为何?)末了,别忘了在用函数时去掉去掉谁人反斜杠,平常的毛病都在这里
25 xml文件：^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
26 中文字符的正则表达式：[\u4e00-\u9fa5]
27 双字节字符：[^\x00-\xff]    (包含汉字在内，能够用来盘算字符串的长度(一个双字节字符长度计2，ASCII字符计1))
28 空缺行的正则表达式：\n\s*\r    (能够用来删除空缺行)
29 HTML标记的正则表达式：<(\S*?)[^>]*>.*?</\1>|<.*? />    (网上撒布的版本太蹩脚，上面这个也仅仅能部份，关于庞杂的嵌套标记照旧无计可施)
30 首尾空缺字符的正则表达式：^\s*|\s*$或(^\s*)|(\s*$)    (能够用来删除行首行尾的空缺字符(包含空格、制表符、换页符等等)，异常有效的表达式)
31 腾讯QQ号：[1-9][0-9]{4,}    (腾讯QQ号从10000最先)
32 中国邮政编码：[1-9]\d{5}(?!\d)    (中国邮政编码为6位数字)
33 IP地点：\d+\.\d+\.\d+\.\d+    (提取IP地点时有效)

    原文作者：double
    原文地址: https://segmentfault.com/a/1190000013796969
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。