JS基础入门篇(三十三)—正则表达式

1.创建一个正则表达式

方法一:使用一个正则表达式字面量,其由包含在斜杠之间的模式组成。

var reg1 = /a/;
var reg2 = /ab+c/;

方法二:调用RegExp对象的构造函数

var reg1 = new RegExp( "a" );
var reg2 = new RegExp( "ab+c" );

2.正则表达式中的特殊字符

1.转义字符

    \s: 空格
    \S: 非空格
    \d: 数字
    \D: 非数字
    \w: 字母,数字,下划线
    \W: 非字母,非数字,非下划线。
    \ 进行转换。模式 /a*/ 代表会匹配 0 个或者多个 a。相反,模式 /a\*/ 将 '*' 的特殊性移除,从而可以匹配像 "a*" 这样的字符串。
    . : 代表 任何一个字符
    \b: 起始,结束,空格。eg:/\bm/匹配“moon”中得‘m’;/oo\b/并不匹配"moon"中得'oo',因为'oo'被一个“字”字符'n'紧跟着。


var str = "12 3123";
console.log( str.replace( /\b/g,"|" ) );//|12| |3123|

2.量词

     {n,m}: n 和 m 都是整数。匹配前面的字符至少n次,最多m次。如果 n 或者 m 的值是0, 这个值被忽略。
     *: 匹配前一个表达式0次或多次。等价于 {0,}。
     +: 匹配前面一个表达式1次或者多次。等价于{1,}。
     ?: 匹配前面一个表达式0次或者1次。{0,1}。
     .: 匹配除换行符之外的任何单个字符。

注意:如果 ? 紧跟在任何量词 *、 +、? 或 {} 的后面,将会使量词变为非贪婪的(匹配尽量少的字符),和缺省使用的贪婪模式(匹配尽可能多的字符)正好相反

3. 字符类
1.[ ]

[]:匹配[]中内容的一个字符.这指的是范围匹配。     
eg:/[a-zA-Z0-9]/:只要是数字,字母都能匹配上。
eg:/[abc]/:只要是a或者b或者c,其中一个都能匹配的上。
eg:/[a-z.]+/:都匹配“test.i.ng”中的所有字符。
[]:内部不需要加|,因为它就表示一个范围,有或者的含义。

举例说明1

            var re = /0|1|2/g;
            var re = /[012]/g;
            var re = /[0-2]/g;
            以上三种正则表达是一个意思

举例说明2

          var re = /^([0-9]|1[0-9])$/g; // 判断数字范围是否在 0-19 之间
          console.log( re.test(20) );//false
          console.log( re.test(2) );//true

2. ^

^ : 匹配输入的开始。
eg: /^A/ 并不会匹配 "an A" 中的 'A',但是会匹配 "An E" 中的 'A'。^表示开始。

注意^放在[]中,表示的意思。

eg: 例如,[^abc] 和 [^a-c] 是一样的。他们匹配"brisket"中的‘r’,也匹配“chop”中的‘h’。 意思是:不是a不是b不是c,则匹配成功。    

3. $

$ : 匹配输入的结束。
eg: /t$/ 并不会匹配 "eater" 中的 't',但是会匹配 "eat" 中的 't'。


3.使用正则表达式的方法,正则的贪婪模式和非贪婪模式

  1. test:使用正则匹配字符串,如果匹配 返回true,否则false
    使用:正则.test(字符串);
<script>
        //1.是否存在数字
        var re1=/\d/;
        console.log(re1.test("asbcc1"));//true
        console.log(re1.test("asbcd"));//false
        //2.是否全是数字
        var re2=/\D/;
        console.log(!re2.test("asbcc1"));//false
        console.log(!re2.test("123445"));//true
</script>

2.search:使用正则匹配字符串,如果匹配 返回对应位置,否则返回-1
使用:字符串.search(正则);
注意:正则区分大小写,如果想不区分大小写,则需要添加标识符 i 。对于两种创建正则的方式,i 有两中不同的写法。

<script>
        var re=/Ao/;
        var str1="aobbbllll";
        console.log(str1.search(re));//-1

        //简写方法 不区分大小写
        var re1=/Ao/i;
        console.log(str1.search(re1));//0


        //调用RegExp对象的构造函数 不区分大小写
        var re2=new RegExp("Ao","i");
        console.log(str1.search(re2));//0
</script>

3.match: 使用正则匹配字符串,如果匹配,返回对应字符串,返回数组形式,否则 null。
使用: 字符串.match(正则)。

注意:
    1. 返回的是类型是数组
    2. 正则默认匹配成功就会停止,使用标识符 g(全局匹配)。

<script>
    var str = "123a456b7890";
    
    var re1 = /\d/;
    var re2 = /\d/g;
    var re3 = new RegExp(/\d/,"g");
    var re4 = /\dA/ig;
    var re5 = new RegExp(/\dA/,"ig");
    console.log( str.match( re1 ) );//["1", index: 0, input: "123a456b7890", groups: undefined]
    console.log( str.match( re2 ) );//["1", "2", "3", "4", "5", "6", "7", "8", "9", "0"]
    console.log( str.match( re3 ) );//["1", "2", "3", "4", "5", "6", "7", "8", "9", "0"]
    console.log( str.match( re4 ) );//["3a"]
    console.log( str.match( re5 ) );//["3a"]
</script>

4.注意:正则的贪婪模式
首先需了解: +的含义是: 匹配前面一个表达式1次或者多次。等价于{1,}。

以下是贪婪模式

<script>
    var str = "6z123a456b7890";
    var re = /\d+/g;
    console.log( str.match( re ) );//["6", "123", "456", "7890"]    
</script>
解释:
1.正则的贪婪模式是指会匹配最长的,得到数目最多的项。
2.如果 ? 紧跟在任何量词 *、 +、? 或 {} 的后面,将会使量词变为非贪婪的(匹配尽量少的字符),和缺省使用的贪婪模式(匹配尽可能多的字符)正好相反。

以下是非贪婪模式

<script>
    var str = "6z123a456b7890";
    var re = /\d+?/g;
    console.log( str.match( re ) );//["6", "1", "2", "3", "4", "5", "6", "7", "8", "9", "0"]
</script>

5.replace:使用正则匹配字符串,如果匹配成功,替换对应字符串,返回匹配后的字符串。如果不成功,则返回原字符串。
使用: 字符串.replace(正则,替换字符串);

<script>
    var str = "miaovketang";
    var re1 = /a/;//不全局匹配,意思为匹配成功就结束
    var re2 = /a/g;//全局匹配,意思为匹配到字符串结束为止。
    console.log( str.replace( re1,"b" ) );//mibovketang
    console.log( str.replace( re2,"b" ) );//mibovketbng
</script>

4.正则的使用

1.敏感词过滤
每个网站都有自己的敏感词,例如这次的敏感词为:星星,好,天空,这三个词。

<script>
        var str="星星挂在天空上好漂亮";
        var re=/星星|天空|好/g;
        var str2=str.replace(re,function ($0) {
            var temp="";
            console.log($0);//replace 第二个参数如果是函数的话,这个函数的第一个参数是每次匹配到的 字符。得到的结果 星星,天空,好
            for(var i=0;i<$0.length;i++){
                temp+="*";
            }
            return temp;
        });

        console.log(str2);
</script>
解析:
1.replace 第二个参数可以是一个字符串,或者函数
2.replace 第二个参数如果是函数的话,这个函数的第一个参数是每次匹配到的 字符。
3.我给参数的命名为$0,这个是随意的,只要不是关键字保留字都可以。例如a,b都可以的。

2.格式化时间
方式一:

<script>
        var str = "2018-6-25"; //转化成 2018.6.25
//      var str = "2018/6/25"; //转化成 2018.6.25
//      var str = "2018~6!25"; //转化成 2018.6.25
//      var str = "2018年6月25"; //转化成 2018.6.25

        var re=/\D/g;
        var str2=str.replace(re,".");

        console.log(str2);//2018.6.25
</script>

方式二:

<script>
        var str = "2018-6-25"; //转化成 2018.6.25
        var re=/(\d+)\D/g;
        var str2=str.replace(re,function ($0,$1) {
            console.log($0,$1);
            return $1+".";
        });

        console.log(str2);//2018.6.25
    </script>
方式二的解析:replace 第二个参数如果是函数的话,
1.这个函数的 第一个参数 是每次匹配到的 字符。
2.之后的参数是通过()的分组,子项按照 "("确定次序。
3.例如第二个参数就是(\d+)匹配到的内容。

3.匹配模式参数的说明
使用情况举例:当使用replace,并且replace的第二个参数是函数。则这个函数的参数情况,第一个参数是正则匹配到的值之后的参数是通过( )的分组,子项按照 "("确定次序。

举例一:

<script>
var str = "2018-6-25"; //2018.6.25
//        var re = /(\d+)\D/g;//使用这个正则,打印结果为:2018.6.25
        var re = /(\d)+\D/g;//使用这个正则,打印结果为:8.6.25
        console.log( str.replace( re,function($0,$1){
            console.log( $0,$1 );
            return $1+".";
        } ) );
</script>

举例二:

<script>
    var str = "2018-6-25"; //2018.6.25
    var re = /(((\d)+)(\D))/g;
    str.replace(re, function ($0, $1, $2, $3, $4) {
        console.log($0, $1, $2, $3, $4);
        //打印结果如下:
        //2018- 2018- 2018 8 -
        //6- 6- 6 6 -
    });
</script>

4.过滤标签

<script>
    var str = "<div>你好,</div><><a>美丽的</a>上海";//想转化成 你好,美丽的上海
    var re=/<.*?>/g; // 如果后面加?,就会进入非贪婪模式。
    // var re=/<.*>/g; //如果后面不加?,就会进入贪婪模式,结果为 上海。
    str2=str.replace(re,"");
    console.log(str2); //你好,美丽的上海。
</script>

5.检查是否含有class名

<body>
    <div id="box" class="div box1 box2"></div>
    <script>
        function checkClass(el,val) {
            var re = new RegExp("\\b"+val+"\\b","g")
            return re.test(el.className);
        }

        var box=document.getElementById("box");
        console.log(checkClass(box,"box2"));//true
        console.log(checkClass(box,"box"));//false
    </script>
</body>

6.找出重复次数最多的字符

方法一:不使用正则。

<script>
    var str = "abcdabcaba";
    var obj={};
    var max=0;//出现次数
    var maxValue = "";//出现的字符
    //生成对象,字符为键名,此时为键值。
    for(var i=0;i<str.length;i++){
        if(!obj[str[i]]){
            obj[str[i]]=1;
        }else{
            obj[str[i]]+=1;
        }
    }
    console.log(obj);
    //遍历进行比较,取出现的最大次数的键名和键值
    //则为出现最多的字符和出现最多的次数。
    for( var i in obj){
        if(max< obj[i]){
            max=obj[i];
            maxValue=i;
        }
    }
    console.log(max,maxValue);
</script>

方法二:使用正则。

<script>
    var str = "abcdabcaba";
    str=str.split("").sort().join("");
    console.log( str );//aaaabbbccd
    var re=/(\w)\1*/g;
    var max=0;
    var maxValue="";
    str.replace(re,function ($0,$1) {
        if(max<$0.length){
            max=$0.length;
            maxValue=$1;
        }
    });
    console.log(max,maxValue);
</script>
解析:\1, \后面的是数字1,不是字母l。
\1是作用是\1前面的表达式,至少要重复一遍。而且前面的表达式要用( )包起来。

\1的使用说明

<script>
    var re = /(\d)\1+/g;
    console.log( re.test( "a00" ) );//true
    console.log( re.test( "a01c" ) );//false
    console.log( re.test( "a012c" ) );//false
    console.log( re.test( "a0123131323c" ) );//false
    console.log( re.test( "a0000c" ) );//true
</script>

7.检测qq号

<body>
<!--
   1. 6-12位 纯数字
   2. 不能以0开头
-->
    <input type="text" id="t" />
    <button id="btn">click</button>
    <script>
        var t = document.getElementById("t");
        var btn = document.getElementById("btn");
        btn.onclick=function () {
            var str=t.value;
            var re=/^([^0]\d{5,11})$/;
            if(re.test(str)){
                console.log("通过验证");
            }else{
                console.log("不通过验证");
            }
        }
    </script>
</body>

8.去掉前后面的空格

<script>
        var str = "  hel lo ";
        console.log( "|"+ str +"|" );
        console.log( "|"+ str.trim() +"|" );//采用trim()方法也可以完成。
        console.log( "|"+ trimFn(str) +"|" );
        
        function trimFn( s ){
            var re = /^\s+|\s+$/g;
            return s.replace( re,"" );
            //return re.test(s);
        }
        
    </script>
    原文作者:梁志芳
    原文地址: https://segmentfault.com/a/1190000015395455
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞