一、案例:

Match类

示例:查找出字符串中包含的url

string text = "FirstUrl: http://www.sohu.com,SecondUrl: http://www.baidu.com ";
string pattern =@"\b(\S+)://(\S+)\b"; //匹配URL的模式
MatchCollectionmc = Regex.Matches(text,pattern); //满足pattern的匹配集合
Console.WriteLine("文本中包含的URL地址有:");
foreach (Matchmatch in mc)
{
  Console.WriteLine(match.Value);
}
Console.ReadLine();

结果:

Group类

示例:找到字符串中包含的url,并找出每个url的协议和域名地址

@"\b(?<protocol>\S+)://(?<address>\S+)\b"; //匹配URL的模式,并分组
MatchCollection mc = Regex.Matches(text,pattern); //满足pattern的匹配集合

Console.WriteLine("文本中包含的URL地址有:");
foreach (Match match in mc)
{
  GroupCollection gc = match.Groups;
  string outputText = "URL:" + match.Value + ";Protocol:" +gc["protocol"].Value+ ";Address:" +gc["address"].Value;
  Console.WriteLine(outputText);
}

Console.Read();

说明:"?<protocol>"和"?<address>"定义了每个组的别名protocol和address

(注意:这是一个match内的设置不同名称的组,对这些组进行提取)

(参考:http://www.jb51.cc/article/p-toaotdxm-vg.htmlhttp://www.jb51.cc/article/p-ftgbstus-vg.html)


二、原理

正则表达式模式可以包含子表达式,这些子表达式是通过将正则表达式模式的一部分用括号括起来定义的每个这样的子表达式构成一个组

Groups 属性提供对有关这些子表达式匹配的信息

例如,与北美电话号码匹配的正则表达式模式(\d{3})-(\d{3}-\d{4}) 有两个子表达式。

第一组由区号构成,它包含电话号码的前三位数字。此组由正则表达式的第一部分(\d{3}) 捕获。

第二组由单个电话号码组成,它包含电话号码的后七位数字。此组由正则表达式的第二部分(\d{3}-\d{4}) 捕获。

然后,可以从由Groups 属性返回的 GroupCollection 对象来检索这两个组,如以下示例所示。

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      string pattern = @"(\d{3})-(\d{3}-\d{4})";
      string input = "212-555-6666 906-932-1111 415-222-3333 425-888-9999";
      MatchCollection matches = Regex.Matches(input,pattern);

      foreach (Match match in matches)
      {
         Console.WriteLine("Area Code:        {0}",match.Groups[1].Value);//字符串内第一个匹配match的第一个组(\d{3})
         Console.WriteLine("Telephone number: {0}",match.Groups[2].Value);
         Console.WriteLine();
      }
      Console.WriteLine();
   }
}
// The example displays the following output:
//       Area Code:        212
//       Telephone number: 555-6666
//       
//       Area Code:        906
//       Telephone number: 932-1111
//       
//       Area Code:        415
//       Telephone number: 222-3333
//       
//       Area Code:        425
//       Telephone number: 888-9999


Match.Groups 属性返回的GroupCollection 对象始终至少具有一个成员

如果正则表达式引擎在特定的输入字符串中找不到任何匹配项,则集合中的单个Group 对象的Group.Success 属性将设置为false,且 Group 对象的Value 属性将设置为String.Empty

如果正则表达式引擎可以找到匹配项Groups 属性返回的GroupCollection 对象的第一个元素将包含一个与整个正则表达式模式匹配的字符串

如果正则表达式包含捕获组,则每个后续元素都表示一个被捕获组。有关详细信息,请参阅“分组构造和正则表达式对象”来区分这篇正则表达式中的分组构造 文章。

下面的示例尝试将正则表达式模式与示例字符串进行匹配。此示例将Groups 属性用于存储要在控制台上显示的匹配项所检索的信息。

using System;
using System.Text.RegularExpressions;

class Example 
{
   static void Main() 
   {
      string text = "One car red car blue car";
      string pat = @"(\w+)\s+(car)";

      // Instantiate the regular expression object.
      Regex r = new Regex(pat,RegexOptions.IgnoreCase);

      // Match the regular expression pattern against a text string.
      Match m = r.Match(text);
      int matchCount = 0;
      while (m.Success) 
      {
         Console.WriteLine("Match"+ (++matchCount));
         for (int i = 1; i <= 2; i++) 
         {
            Group g = m.Groups[i];
            Console.WriteLine("Group"+i+"='" + g + "'");
            CaptureCollection cc = g.Captures;
            for (int j = 0; j < cc.Count; j++) 
            {
               Capture c = cc[j];
               System.Console.WriteLine("Capture"+j+"='" + c + "',Position="+c.Index);
            }
         }
         m = m.Nextmatch();
      }
   }
}
// This example displays the following output:
//       Match1
//       Group1='One'
//       Capture0='One',Position=0
//       Group2='car'
//       Capture0='car',Position=4
//       Match2
//       Group1='red'
//       Capture0='red',Position=8
//       Group2='car'
//       Capture0='car',Position=12
//       Match3
//       Group1='blue'
//       Capture0='blue',Position=16
//       Group2='car'
//       Capture0='car',Position=21


三、分组构造和正则表达式对象

由正则表达式捕获组匹配的子字符串由 System.Text.RegularExpressions.Group 对象表示,其从 System.Text.RegularExpressions.GroupCollection 对象检索,其由 Match.Groups 属性返回。填充 GroupCollection 对象,如下所示:
集合中的第一个 Group 对象(位于索引零的对象)表示整个匹配

•下一组 Group 对象表示未命名(编号)的捕获组。它们以在正则表达式中定义的顺序出现,从左至右。这些组的索引值范围从 1 到集合中未命名捕获组的数目。(特定组索引等效于其带编号的反向引用。有关向后引用的更多信息,请参见正则表达式中的反向引用构造。)

•最后的 Group 对象组表示命名的捕获组。它们以在正则表达式中定义的顺序出现,从左至右。第一个名为捕获组的索引值是一个大于最后一个未命名的捕获组的索引。如果正则表达式中没有未命名捕获组,则第一个命名的捕获组的索引值为零。


如果将限定符应用于捕获组则对应的 Group 对象的 Capture.Value、 Capture.Index 和 Capture.Length 属性反映捕获组捕获的最后一个子字符串。可以检索一整组子字符串,其是按组捕获的并具有来自 CaptureCollection 对象的限定符,其由 Group.Captures 属性返回

下面的示例阐释 Group 和 Capture 对象之间的关系。

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      string pattern = @"(\b(\w+)\W+)+";
      string input = "This is a short sentence.";
      Match match = Regex.Match(input,pattern);
      Console.WriteLine("Match: '{0}'",match.Value);
      for (int <span style="color:#ff0000;">ctr = 1</span>; ctr < match.Groups.Count; ctr++)
      {
         Console.WriteLine("   Group {0}: '{1}'",ctr,match.Groups[ctr].Value);//<span style="color:#ff0000;">ctr = 1开始match内部数组检索</span>
         int capCtr = 0;
         foreach (Capture capture in match.Groups[ctr].Captures)//<span style="color:#ff0000;">ctr = 0开始</span>
         {
            Console.WriteLine("      Capture {0}: '{1}'",capCtr,capture.Value);
            capCtr++;
         }
      }
   }
}
// The example displays the following output:
//       Match: 'This is a short sentence. '
//          Group 1: 'sentence.'
//             Capture 0: 'This '
//             Capture 1: 'is '
//             Capture 2: 'a '
//             Capture 3: 'short '
//             Capture 4: 'sentence.'
//          Group 2: 'sentence'
//             Capture 0: 'This'
//             Capture 1: 'is'
//             Capture 2: 'a'
//             Capture 3: 'short'
//             Capture 4: 'sentence'


更多参考:https://msdn.microsoft.com/zh-cn/library/bs2twtah.aspx

正则表达式match和group的区别 具有相同模式的字符串使用组的提取案例及原理的更多相关文章

  1. HTML5数字输入仅接受整数的实现代码

    这篇文章主要介绍了HTML5数字输入仅接受整数的实现代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  2. ios – 使用大写符号在字符串swift中获取URL的正则表达式

    我尝试在文本中获取URL.所以,在此之前,我使用了这样一个表达式:但是当用户输入带有大写符号的URL时(例如Http://Google.com,它与它不匹配)我遇到了问题.我试过了:但什么都没发生.解决方法您可以使用正则表达式中的i内联标志关闭区分大小写,有关可用正则表达式功能的详细信息,请参阅FoundationFrameworkReference.(?ismwx-ismwx)Flagsetti

  3. ios – 如何在Swift 3中使用正则表达式?

    解决方法我相信.当没有其他选项适用时,将使用.allZeros.因此,使用Swift3,您可以传递一个空的选项列表或省略options参数,因为它默认为无选项:要么请注意,在Swift3中,您不再使用error参数.它现在抛出.

  4. ios – lldb断点在类目标c中的所有方法

    如何使用lldb在ObjectiveC类中的所有方法上自动设置断点?

  5. swift的正则表达式(NSRegularExpression)

    init(_pattern:String){varerror:NSError?

  6. swift 正则表达式运用实例选自《swifter 100个swift开发必备tip 》

  7. 可以匹配就匹配咯: 详解 Swift 的模式匹配

    怒戳查看最终稿@SwiftGG在众多Swift提供给Objective-C程序员使用的新特性中,有个特性把自己伪装成一个无聊的老头,但是却在如何优雅滴解决“鞭尸金字塔“的问题上有着巨大的潜力。很显然我所说的这个特性就是switch语句,对于很多Objective-C程序员来说,除了用在Duff’sDevice上比较有趣之外,switch语句非常笨拙,与多个if语句相比,它几乎没有任何优势。不过Sw

  8. Swift中的模式匹配

    模式是用于匹配的规则值,如switch语句的case,do语句的catch子句,以及if、while、guard、for-in语句的条件。例如,假设你想判断一个整数是大于、小于还是等于零,你可以用if-elseif-else语句,尽管这并不美观:letx=10ifx>0{print}elseifx原文查看:http://bbs.a-coder.cn/thread-7-1-1.html

  9. 《swift2.0 官方教程中文版》 第3章-05模式

    letpoint=(3,2)switchpoint{caselet(x,y):print}//prints"Thepointisat(3,2).”/*元组模式********************************************///元组模式是逗号分隔的,有零个或多个模式的列表,并被一对圆括号括起来。枚举用例模式出现在switch语句中的case标签中,以及if,while,guard和for-in语句的case条件中。is模式和is操作符有相似表现,它们都进行类型转换,却舍弃返回的类型

  10. 模式匹配第一弹: switch, enums &amp; where 子句

    本文作为模式匹配的第一篇介绍文章,旨在抛砖引玉。Switch基本用法Swift中最简单、最为常见的模式匹配就是switch语句,大家对下面的形式都比较熟悉了:但是switch可以更进一步,允许使用包含变量的匹配模式,并在匹配时绑定这些变量。下一部分的计划这篇文章很简单,带你回顾了swith中的一些基本的模式匹配,下一部分将探讨更高级的用法,包括:在enum之外的其他地方使用switch与其他语句一起配合使用模式匹配,包括ifcase,guardcase,forcase,=~,…

随机推荐

  1. 法国电话号码的正则表达式

    我正在尝试实施一个正则表达式,允许我检查一个号码是否是一个有效的法国电话号码.一定是这样的:要么:这是我实施的但是错了……

  2. 正则表达式 – perl分裂奇怪的行为

    PSperl是5.18.0问题是量词*允许零空间,你必须使用,这意味着1或更多.请注意,F和O之间的空间正好为零.

  3. 正则表达式 – 正则表达式大于和小于

    我想匹配以下任何一个字符:或=或=.这个似乎不起作用:[/]试试这个:它匹配可选地后跟=,或者只是=自身.

  4. 如何使用正则表达式用空格替换字符之间的短划线

    我想用正则表达式替换出现在带空格的字母之间的短划线.例如,用abcd替换ab-cd以下匹配字符–字符序列,但也替换字符[即ab-cd导致d,而不是abcd,因为我希望]我如何适应以上只能取代–部分?

  5. 正则表达式 – /bb | [^ b] {2} /它是如何工作的?

    有人可以解释一下吗?我在t-shirt上看到了这个:它似乎在说:“成为或不成为”怎么样?我好像没找到’e’?

  6. 正则表达式 – 在Scala中验证电子邮件一行

    在我的代码中添加简单的电子邮件验证,我创建了以下函数:这将传递像bob@testmymail.com这样的电子邮件和bobtestmymail.com之类的失败邮件,但是带有空格字符的邮件会漏掉,就像bob@testmymail也会返回true.我可能在这里很傻……当我测试你的正则表达式并且它正在捕捉简单的电子邮件时,我检查了你的代码并看到你正在使用findFirstIn.我相信这是你的问题.findFirstIn将跳转所有空格,直到它匹配字符串中任何位置的某个序列.我相信在你的情况下,最好使用unapp

  7. 正则表达式对小字符串的暴力

    在测试小字符串时,使用正则表达式会带来性能上的好处,还是会强制它们更快?不会通过检查给定字符串的字符是否在指定范围内比使用正则表达式更快来强制它们吗?

  8. 正则表达式 – 为什么`stoutest`不是有效的正则表达式?

    isthedelimiter,thenthematch-only-onceruleof?PATTERN?

  9. 正则表达式 – 替换..与.在R

    我怎样才能替换..我尝试过类似的东西:但它并不像我希望的那样有效.尝试添加fixed=T.

  10. 正则表达式 – 如何在字符串中的特定位置添加字符?

    我正在使用记事本,并希望使用正则表达式替换在字符串中的特定位置插入一个字符.例如,在每行的第6位插入一个逗号是什么意思?如果要在第六个字符后添加字符,请使用搜索和更换从技术上讲,这将用MatchGroup1替换每行的前6个字符,后跟逗号.

返回
顶部