JavaScript正则表达式

媒介

本文主假如在读《JavaScript高等程序语言设想》一书有关正则表达式的章节的知识点纪录,轻易后续查阅。

什么是正则表达式

正则表达式是用来形貌字符组合的某种划定规矩。它可以协助考证字符串是不是满足某种字符组合划定规矩或许经由过程某个划定规矩查找对应的字符序列。

举个例子:比方我想考证一个输入框中输入的是不是是手机号码,那末我们须要为这个输入框定义一个输入划定规矩,比方11位字符、每一个字符都必需是0-9、以及更细节的信息像第一位不能是0等划定规矩。此时我们就可以定义一个正则表达式,将一切的划定规矩经由过程正则表达出来,去考证输入框的内容是不是满足正则表达式定义的划定规矩。

JavaScript中定义正则表达式对象

JavaScript中的正则表达式对象有两种定义体式格局:正则表达式直接量RegExp()组织函数。定义代码以下:

    //定义JavaScript正则对象的两种体式格局
    var pattern = /s$/;
    var pattern = new RegExp("s$");

直接量字符

  正则表达式中一切字母和数字都是按字面寄义举行婚配的,比方’a’就可以婚配到’a’字符。
  JavaScript也支撑非字母的字符婚配。正则表达式经由过程””+字母的情势将字母原本的寄义举行了转义来示意其他特别的字符。比方\n婚配换行符。
  正则表达式中许多标记具有特别寄义:^ $ . * + ? = ! : | / () [] {}。假如想要婚配这些字符须要运用”\”举行转义。

字符类

  如今我们晓得我们可以用a去婚配a字符,b去婚配b字符。那末假如我须要婚配一切的小写字母该怎么做?
  正则表达式运用[]来组织一个字符类。一个字符类可以婚配它所包括的恣意一个字符。比方/[abc]/就可以婚配字母”a”、”b”或”c”中的恣意一个。另外在字符类中运用^可以举行否认操纵,比方’/[^abc]/’示意婚配”a”、”b”或”c”以外的恣意一个字符。
  字符类还可以运用连字符示意字符局限,比方/[a-z]/婚配一切小写字母。由于某些字符类异常经常使用,所以正则范例了一些特别字符示意一个特定的字符类,比方/\w/等价于[a-zA-Z0-9]。

反复

  如今我们有有了新的需求,就是想要某个字符类婚配屡次,比方婚配5-7个数字,可以运用/\d{5,7}/举行婚配,由于某些反复品种异常经常使用,所以正则范例了特别标记来示意,比方”+”示意婚配1次或屡次,等价于{1,}等。

非贪欲的反复

  运用反复举行婚配时会尽量多的举行婚配,我们称之为贪欲婚配。比方/a+/可以婚配一个或多个一连的字母a,当运用”aaa”作为婚配字符串时,正则表达式会婚配一连的三个a。
非贪欲婚配只需在待婚配字符后追随一个?,比方:”??”、”+?”、”*?”或”{1,5}?”。比方/a+?/也可以婚配一个或多个一连的字母a,然则它会尽量少的婚配。

挑选、分组和援用

挑选

  挑选:字符”|”用于分开可挑选的字符,比方/d{3}|[a-z]{4}/可以婚配三位数字或许四个小写字母。挑选项的尝试婚配序次是从左到右的,而且发明婚配项后就会疏忽背面的挑选项。因而正则/a|ab/婚配字符串”ab”时只会婚配到第一个字母a。

分组

  将子表达式组合成一个自力单位,这就可以运用”|”、”*”等来对这个单位举行处置惩罚。比方/Java(script)?/可以用来婚配java或javascript,也就是script这个组合可以涌现0-1次。

援用

  ()小括号除了可以将子表达式组合成一个自力单位,还可以定义子形式。当一个正则表达式成功地和目的字符串婚配时,可以从目的字符串中提掏出和圆括号中的子形式相婚配的部份。背面会举行细致引见。
  援用就是许可在同一个正则表达式的后部援用前面的子表达式。这是经由过程在字符””后加一个数字来完成的。这个数字制订了带圆括号的子表达式在正则表达式中的位置。这个位置是介入计数的左括号的位置。比方/([Jj]ava([Ss]cript)?)siss(funw*)/正则中([Ss]cript)可以运用2来指代。对正则表达式中前一个子表达式的援用,并非指对子表达式形式的援用,而是指与谁人形式婚配的文本的援用。如许,援用可以用于实行一条束缚,即一个字符串各个零丁部份包括的是完全相同的字符。比方/‘”[‘”]/婚配位于单引号或双引号之间的0个或多个字符,然则它并不请求左边和右边的引号婚配,假如要婚配摆布的引号范例,可以运用援用/([‘”])[w]1/。
  假如不想天生带编码的援用,可以运用”(?:)”举行组合,不影象与改组相婚配的字符。

指定婚配位置

  有一些正则表达式的元素婚配的是字符之间的位置,而不是现实字符。比方b婚配一个单词的边境。偶然称这些元素为正则表达式的锚,由于它们将形式定位在目的字符串的特定位置上。最常见的锚元素是^,用来婚配字符串的最先,锚元素$用来婚配字符串的末端。
  任何正则表达式都可以作为锚点前提,假如在标记”(?=”和”)”之间到场一个表达式,它就是一个先行断言。用来申明圆括号内的表达式必需准确婚配。比方要婚配一个程序设想语言的名字,但只在其后有冒号时才婚配,可以运用/[jJ]ava([sS]cript)?(?=:)/。
  带有”(?!”和”)”的断言是负向先行断言。用以指定接下来的字符都不婚配。比方/Java(?!Script)([A-Z]w*)/,用来婚配Java背面跟一个大写字母和恣意个ASCII单词,但Java背面不能追随”Script”。

修饰符

  修饰符用来申明高等婚配形式的划定规矩。JavaScript支撑3个修饰符:i、g和m。

  • i:修饰符”i”用以申明形式婚配是不辨别大小写的。

  • g:修饰符”g”用以申明形式婚配是全局的,也就是应当检索出字符串中的一切婚配。

  • m:修饰符”m”用以申明在多行形式中实行婚配。在这类形式下,假如待检索的字符串包括多行,那末^和锚字符除了婚配全部字符串的最先和末端以外,还可以婚配每行的最先和末端。比方/java/im可以婚配”Java”,也可以婚配”java\nis fun”。

String范例用于形式婚配的要领

  JavaScript的String范例支撑4种运用正则表达式的要领。

  1. search():吸收一个参数(字符串范例或许是正则对象),返回值是stringObject 中第一个与 regexp 相婚配的子串的肇端位置。

  2. replace():replace() 要领用于在字符串顶用一些字符替代另一些字符,或替代一个与正则表达式婚配的子串。该要领吸收两个参数,第一个参数划定子字符串或要替代的形式的 RegExp 对象。第二个参数吸收一个字符串值。划定了替代文本或天生替代文本的函数。假如正则表达式设置了修饰符g,那末源字符串中一切与形式婚配的子字符串都将被替代。但replace()的功用远不止纯真的替代,正则表达式中可以运用圆括号建立子表达式,正则表达式会影象与每一个子表达式婚配的文本。假如在替代字符串中涌现了$加数字,那末replace()将与指定的子表达式相婚配的文原本替代。replace()的第二个参数可以吸收一个函数来动态盘算替代字符串。

  3. match():match()要领可在字符串内检索指定的值,或找到一个或多个正则表达式的婚配。该要领相似 indexOf() 和 lastIndexOf(),然则它返回指定的值,而不是字符串的位置。假如设置了修饰符g,则返回一切婚配效果。没有设置则只检索第一个婚配。纵然不是全局搜刮,也会返回一个数组,这类情况下,数组的第一个元素是婚配的字符串,余下的是子表达式对应的字符串。参数传入字符串相当于传入了一个非全局的正则表达式。

  4. split():split() 要领用于把一个字符串支解成字符串数组。语法是stringObject.split(separator,howmany),separator可所以字符串或正则表达式,从该参数指定的处所支解 stringObject。howmany可选。该参数可指定返回的数组的最大长度。假如设置了该参数,返回的子串不会多于这个参数指定的数组。假如没有设置该参数,全部字符串都会被支解,不斟酌它的长度。

RegExp对象

  建立RegExp对象时吸收两个参数:正则字符串和修饰符。

    //注重"\"须要运用"\\"举行示意
    var zipcode = new RegExp("\\d{5}", g);

RegExp的属性

  每一个RegExp对象都包括5个属性。

  1. source:是一个只读字符串,包括正则表达式的文本。

  2. global:用来申明这个正则表达式是不是带有修饰符g

  3. ignoreCase:用来申明正则表达式是不是带有修饰符i

  4. multiline:用来申明正则表达式是不是带有修饰符m

  5. lastIndex:这是一个可读写的整数。假如婚配形式带有g修饰符,这个属性存储全部字符串中下一次检索的最先位置,这个属性会被exec()和test()要领用到。

RegExp的要领

  RegExp对象定义了两个用于实行形式婚配的操纵要领。

  1. exec():exec()吸收一个字符串参数,要领的作用就是在参数字符串中实行婚配检索。假如它没有找到婚配就返回true。但假如它找到了婚配,它将返回一个数组,这个数组的第一个元素包括的是与正则表达式相婚配的字符串,余下的元素是与圆括号内的子表达式相婚配的子串。属性index包括了发作婚配的字符串位置,属性input援用的是正在实行检索的字符串。exec()老是返回一个婚配效果,并供应本次婚配的一切相干信息。当挪用exec()的正则表达式对象具有g修饰符时,它将把正则表达式对象的lastIndex属性设置为紧挨着婚配子串的字符位置。当再次挪用exec()时,它将从字符串的lastIndex位置最先向后举行检索。假如exec()没有查询到效果,它将把lastIndex设置为0.

  2. test():test()的运行机制和exec()一致,只不过它只返回true和false

    原文作者:garyli
    原文地址: https://segmentfault.com/a/1190000007834640
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞