JavaScript 正则一篇入门,不入魂

共 1199字,需浏览 3分钟

 ·

2020-03-28 23:23

00c18400e563872314ac7a15171c5d92.webp

                                程序员宝库



关注即可获得新技能!

6ee2e6121b4c069de6612d9d04ca3376.webp 


这里不会对正则的背景进行介绍,将直接对正则的使用进行讲解。

注意:有一些文章和书本可能为了让正则表达式看起来不那么密密麻麻,而在正则表达式里加了空格隔开,例如 /(\w+)\s(\w+)/,这个表达式可以匹配Hello RegExp,但有的文章和书本里写成 /(\w+) \s (\w+)/,这样的话就不是匹配Hello RegExp,而是匹配Hello RegExp中间再加两个空格。

Javascript正则表达式的定义

1.构造函数定义

构造函数定义接受两个参数,一个是要匹配的字符串模式(注意此参数是字符串,不能是正则表达式字面量),另一个是可选的标志字符串,即g,i,m

  1. var reg =newRegExp("java[script]",'gim');    

g,i,m为可选属性。

  • g–全文查找,即模式被应用于所有字符串,而并非在发现第一个匹配项时立即停止

  • i–忽略大小写

  • m–多行查找,即在到达一行文本末尾时还会继续查找下一行中是否存在模式匹配的项

2.字面量定义

  1. var reg =/(\w+)\s(\w+)/;

3.构造函数定义与字面量定义比较

由于构造函数定义的参数是字符串,所以在某些情况下要对字符串进行双重转义。另外所有的元字符都必须进行双重转义,那些已经转义过的字符串也是如此,以下左边为字面量模式,右边为等价的构造函数定义时使用的字符串参数。

字面量模式等价的字符串
/\w/"\\w"
/\[java\]script/"\\[java\\]script"
/\.com/"\\.com"
/China\/Eng/"China\\/Eng"
/\d\.\d{1,2}/"\\d\\.\\d{1,2}"
/\w\\hello"\\w\\\\hello"

在ECMAScript3中,正则表达式字面量会始终共享同一个RegExp实例,而使用构造函数创建的每一个新RegExp都是一个新的实例。

  1. var reg =null,i;

  2. for(i =0; i <10; i++){

  3.    reg =/java/g;

  4.    reg.test("javascript");

  5. }

  6. for(i =0; i <10; i++){

  7.    reg =newRegExp("java","g");

  8.    reg.test("javascript");

  9. }

第一个循环中第一次调用test()找到了”java”,但第二次调用从索引为3(上一次匹配的末尾)的字符开始,所以第二次就匹配不到,由于匹配会一直找到字符串末尾,所以下一次再调用test()又会重头开始。

第二个循环使用构造函数在每次循环中创建正则表达式,因为每次迭代都会创建一个新的RegExp实例,所以每次调用test()都会返回true。

注意,在ECMAScript5中,正则表达式字面量和构造函数一样,每次都会创建新的RegExp实例。所以ECMAScript5往后上面两个循环结果都一样。

正则表达式的属性和方法

1.正则属性

属性名说明
input 或 $_返回最近一次要匹配的字符串
lastMatch 或 ><返回最近一次的匹配项
lastParen 或 $+返回最近一次匹配的捕获组
leftContext 或
input字符串中lastMatch之前的文本
rightContext 或 $’input字符串中lastMatch之后的文本
Multiline 或 $*返回布尔值,表示是否所有表达式都使用多行模式
  1. var text ="this has been a short summer";

  2. var pattern =/(.)hort/g;

  3. if(pattern.test(text)){

  4. alert(RegExp.input);               //this has been a short summer

  5. alert(RegExp.leftContext);         //this has been a            

  6. alert(RegExp.rightContext);        // summer

  7. alert(RegExp.lastMatch);           //short

  8. alert(RegExp.lastParen);           //s

  9. alert(RegExp.multiline);           //false

  10. }

注意:某些属性在某些浏览器可能未实现。

除了上面的几个属性外,还有9个用于存储捕获组的属性。访问语法是RegExp.$1,RegExp.$2…RegExp.$9,在调用test()和exec()方法时,这些属性会被自动填充。

  1. var text ="this has been a short summer";

  2. var pattern =/(..)or(.)/g;

  3. if(pattern.test(text)){

  4. alert(RegExp["$1"]);       //sh

  5. alert(RegExp["$2"]);       //t

  6. alert(RegExp["

    entry-content" data-v-3f216172="" data-v-41d33d72="""]);       //this has been a

  7. alert(RegExp["/div>"]);       // summer

  8. }

2.正则方法

(1)exec(str)

exec()方法接受一个参数,即要应用模式的字符串,返回包含第一个匹配项信息的数组,没有匹配项的情况下返回null。返回的是Array实例,另外还包含两个额外的属性,index和input,index表示匹配项在字符串中的位置,input表示应用正则表达式的字符串。

  1. var text ="mom and dad and baby";

  2. var reg =/mom( and dad( and baby)?)?/gi;

  3. var matches = reg.exec(text);

  4. alert(matches.index);    //0

  5. alert(matches.input);    //"mom and dad and baby"

  6. alert(matches[0]);       //"mom and dad and baby"

  7. alert(matches[1]);       //" and dad and baby"

  8. alert(matches[2]);       //" and baby"

对于exec()方法而言,在模式中设置了g,它每次也只返回一个匹配项,但每次调用exec()都会在字符串中继续查找新的匹配项,如不设置g,每次调用exec()都只返回第一个匹配的信息。

  1. var text ="cat, bat, sat, fat";        

  2. var pattern1 =/.at/;

  3. var matches = pattern1.exec(text);        

  4. alert(matches.index);     //0

  5. alert(matches[0]);        //"cat"

  6. alert(pattern1.lastIndex);//0

  7. matches = pattern1.exec(text);        

  8. alert(matches.index);     //0

  9. alert(matches[0]);        //"cat"

  10. alert(pattern1.lastIndex);//0

  11. var pattern2 =/.at/g;

  12. var matches = pattern2.exec(text);        

  13. alert(matches.index);     //0

  14. alert(matches[0]);        //"cat"

  15. alert(pattern2.lastIndex);//3

  16. matches = pattern2.exec(text);        

  17. alert(matches.index);     //5

  18. alert(matches[0]);        //"bat"

  19. alert(pattern2.lastIndex);//8

(2)test(str)

test()方法接受一个字符串参数。在模式与该参数匹配的情况下返回true,否则返回false。

(3)replace(RegExp/str,str_replace)

replace()方法接受两个参数,第一个参数为字符串或RegExp对象,第二个参数为字符串或一个回调函数。

若为字符串,第二个参数将替换第一个参数匹配到的值,然后将替换后的原文本作为返回值返回,其中第二个参数中可包含RegExp的特殊字符序列,例如$1~$9,表示从原文本中捕获到的对象,使用$1~$9属性时,第一个参数必须是RegExp对象,且需用()来捕获。

下面是一些ECMAScript提供的特殊字符串序列:

字符序列替换文本
$$
><匹配整个模式的子字符串,与RegExp.lastMatch值相同
$’匹配的子字符串之前的字符串,与RegExp.leftContext的值相同
匹配的子字符串之后的字符串,与RegExp.rightContext的值相同
$n匹配第n个捕获组的子字符串,n等于0-9,如果正则中没有定义捕获组,则为空字符串
$nn匹配第nn个捕获组的子字符串,n等于01-99,如果正则中没有定义捕获组,则为空字符串

注意调用函数str.replace(),并不改变str的值,而是返回一个副本。

  1. var text ="first_second";

  2. var text_replaced = text.replace(/first/,"1");

  3. alert(text);    //first_second

  4. alert(text_replaced);    //1_second

  5. text_replaced = text.replace(/(first)/,"1$1");

  6. alert(text_replaced);     //1first_second

  7. text_replaced = text.replace(/(first)/,"1

    entry-content" data-v-3f216172="" data-v-41d33d72=""");

  8. alert(text_replaced);     //1_second

若第二个参数是一个函数,那么这个函数的有三个参数,分别代表匹配到的字符串,匹配的字符串在位置,和原字符串,后两个参数是可选。常见用法如下:

  1. function htmlEscape(text){

  2.            return text.replace(/[<>"&]/g,function(match, pos, originalText){

  3.                switch(match){

  4.                    case"<":

  5.                        return"<";

  6.                    case">":

  7.                        return">";

  8.                    case"&":

  9.                        return"&";

  10.                    case"\"":

  11.                        return""";

  12.                }            

  13.            });

  14.        }

  15. alert(htmlEscape("

    Hello world!

    "));

  16. //

    Hello world!

00c18400e563872314ac7a15171c5d92.webp

                                程序员宝库



关注即可获得新技能!

6ee2e6121b4c069de6612d9d04ca3376.webp 
浏览 32
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报