阿西河

所有教程

公众号
🌙
阿西河前端的公众号

我的收藏

    最近访问  (文章)

      教程列表

      抓包专区
      测试专区

      正则的捕获

      正则的捕获

      每一次捕获的时候都是先进行默认的匹配,如果没有匹配成功的,捕获的结果是 null; 只有有匹配的内容我们才能捕获到;

      • 知识点一、正则捕获的内容格式
      • 知识点一、正则捕获的特点
      • 知识点一、字符串中的 match 方法 ->把所有和正则匹配的字符都获取到

      知识点一、捕获的内容格式

      • 捕获到的内容是一个数组
        • 数组中的第一项是当前大正则捕获的内容
        • index: 捕获内容在字符串中开始的索引位置
        • input: 捕获的原始字符串

      知识点二、正则捕获的特点

      正则的匹配,是少餐多食,能少匹配次数就少匹配,每一次匹配,能匹配到多少数据就匹配多少数据;

        1. 懒惰性 ->每一次执行 exec 只捕获第一个匹配的内容,在不进行任何处理的情况下,在执行多次捕获,捕获的还是第一个匹配的内容

      lastIndex: 是正则每一次捕获在字符串中开始查找的位置,默认的值是 0(上次一次查找的结束位置)

           var reg = /\d+/;
           var str = "zhu2015an2016";
           console.log(reg.lastIndex);//0
           var res = reg.exec(str);
           console.dir(res);//->["2015"...]
           // 我们第二次通过 exec 捕获的内容还是第一个"2015"
      
           console.log(reg.lastIndex);//0 说明我们第二次捕获的时候也是要从字符串索引 0 处开始查找
           res = reg.exec(str);
           console.dir(res);//->["2015"...]
      
        1. 如何解决懒惰性?->在正则的末尾加一个修饰符"g"
        • img 分别代表的意义;
        • ignoreCase(i): 忽略大小写匹配 表示不区分大小写(case-insensitive)模式,即在确定匹配项时忽略模式与字符串的大小写;
        • multiline(m): 多行匹配; 表示多行(multiline)模式,即在到达一行文本末尾时还会继续查找下一行中是否存在与模 式匹配的项。
        • global(g): 全局匹配;表示全局(global)模式,即模式将被应用于所有字符串,而非在发现第一个匹配项时立即停止

      原理:加了全局修饰符 g, 正则每一次捕获结束后,我们的 lastIndex 的值都变为了最新的值,下一次捕获从最新的位置开始查找,这样就可以把所有需要捕获的内容都获取到了

          var reg = /\d+/g;
          var str = "zhu2015an2016zhu2017";
          console.log(reg.lastIndex);//->0
      
          console.log(reg.exec(str));//->["2015", index: 3, input: "zhu2015an2016zhu2017"]
          console.log(reg.lastIndex);//->7
      
          console.log(reg.exec(str));//->["2016", index: 9, input: "zhu2015an2016zhu2017"]
          console.log(reg.lastIndex);//->13
      
          console.log(reg.exec(str));//->["2017", index: 16, input: "zhu2015an2016zhu2017"]
          console.log(reg.lastIndex);//20
      
          var str1="asdsda";
          var str2="dddbat";
          var str3="dddbat";
      
          // 匹配字符串中所有"at"的实例
          var pattern1 = /at/g;
          console.log(pattern1.test(str1));//false
          console.log(pattern1.test(str2));//true
          console.log(pattern1.test(str3));//false  【这里是 falst】
      
          // 匹配第一个"bat"或"cat",不区分大小写
          var pattern2 = /[bc]at/i;
      
          // 匹配所有以"at"结尾的 3 个字符的组合,不区分大小写
          var pattern3 = /.at/gi;
      
        1. 自己编写程序获取正则捕获的所有的内容(一定不要忘记加 g)

          var reg1=/\d+/g, str1=“zhu2015an2016zhu2017”, ary=[], res=reg1.exec(str1);s

          while(res){ ary.push(res[0]); res=reg1.exec(str1); } console.log(ary);//[“2015”, “2016”, “2017”]

        1. 贪婪性 正则的每一次捕获都是按照匹配最长的结果捕获的,例如:2 符合正则 2015 也符合正则,我们默认捕获的是 2015

          var reg = /\d+/g;//->出现一到多个 0-9 之间的数字 var str = “zhu2015an2016zhu2017”; console.log(reg.exec(str));//->[“2015”…]

        1. 如何解决正则的贪婪性 ->在量词元字符后面添加一个?即可
        • ? 在正则中有很多的作用:

        • 放在一个普通的元字符后面代表出现 0-1 次 /\d?/ ->数字可能出现也可能不出现

        • 放在一个量词的元字符后面是取消捕获时候的贪婪性

            var reg = /\d+?/g;
            var str = "zhu2015an2016zhu2017";
          
            console.log(reg.exec(str));//->["2"...]
          
            var ary = [],
                res = reg.exec(str);
            while (res) {
                   ary.push(res[0]);
                   res = reg.exec(str);
                }
            console.log(ary);//["0", "1", "5", "2", "0", "1", "6", "2", "0", "1", "7"]
          

      知识点三、字符串中的 match 方法 ->把所有和正则匹配的字符都获取到

      var reg = /\d+?/g;
      var str = "zhu2015an2016zhu2017";
      var ary = str.match(reg);
      console.log(ary);
      

      match 的缺点:虽然在当前的情况下 match 比我们的 exec 更加的简便一些,但是 match 中存在一些自己处理不了的问题:在分组捕获的情况下,match 只能捕获到大正则匹配的内容,而对于小正则捕获的内容是无法获取的;

      ————– 以前的 —-

      实现正则捕获的办法

      • 正则 Regexp.prototype 上的方法
        • exec
        • test
      • 字符串 String.prototype 上支持正则表达式处理的方式
        • replace
        • match
        • splite

      把下面所有数字匹配出来

      let str = "axihe2020an06bang30";
      

      捕获的前提

      捕获的前提是,当前正则要和字符串匹配,如何不匹配就不存在捕获!

      下面的正则就是捕获不了!

      let str = "axihe2020an06bang30";
      let reg = /^\d+$/;
      console.log(reg.test(str));//false
      console.log(reg.exec(str));//null
      

      下面这种就是可以的;

      let str = "axihe2020an06bang30";
      let reg = /\d+/;
      console.log(reg.test(str));//true
      console.log(reg.exec(str));//["2020", index: 5, input: "axihe2020an06bang30", groups: undefined]
      

      总结下 exec 方法

      通过exec实现正则捕获

      通过exec实现正则捕获

      • exec 未捕获到,结果是 null
      • 如果捕获成功,返回一个数组
        • 第一项:本次捕获到的内容
        • 其余项:对应小分组本次单独捕获的内容
        • index: 当前捕获内容在字符串的起始索引
        • input: 原始 字符串
      目录
      目录