正则表达式参考 TCL语言版收藏

作者:admin 来源:未知

按照类型划分,上面表格中的特殊字符分为几个类型:

字符关键字:

这部分关键字包括26个英文字符(上面的表格没有列出来)。这些关键字的特点就是它们匹配自身。

数量关键字:

这部分关键字包括.(点)*(星号)+(加号)?(问号)这4个关键字,这中间.(点)这个关键字稍微特殊一点,因为它有2个作用:既可以作为字符关键字表示任何字符,又可以作为数量关键字代表1个字符。


【任何字符】这个含义很深,因为――空字符也算任何字符,也就是说一个点可以表示有一个字符,也可以表示没有字符,这个概念是新手很容易犯错的地方。

量关键字本身没有任何用处,它必须和【模式】这个概念一起共同作用,在正则表达式中,【模式】可以说是最为核心也最为广泛的内容。总体来说,模式就是用来表示自己想匹配字符的方法,但实际上模式的概念要更为复杂和广泛,这部分内容我会在后面有更详细的描述,就现在来说,你只要理解,数量关键字必须与模式一起共用就可以了。

模式关键字:

()(括号)|(竖号)[](中括号)^(尖号)$(美元号)这5个符号都属于模式关键字,它们要么代表模式本身(括号、竖号、中括号),要么作用于模式为模式提供其他更高级的功能(尖号、美元号)。

现在,我们从另一个角度来看这些关键字,下面的内容,详细说明这9个关键字所起的作用以及实际表达方法,这部分会有一些比较详细的说明和实例,但是在此之前,我们必须了解一下什么是模式:


什么是模式?

模式就是一组用来匹配字符的关键字集合,一个最小的模式只有一个关键字,而大的模式则可以有无数个关键字:

A这是一个模式,代表A这个字符本身

A+这也是一个模式,代表一个或者任意多个A字符

正则表达式中,数量关键字都是作用于左边模式的,上面的例子中,A是一个没有数量关键字的模式,而A+中的+号就向左作用于前面这个A模式,如果没有A这个模式,+号本身是没有任何意义的,这里A虽然是一个字符,但是我觉得把A称为模式能更清楚的理解模式的含义。

正则表达式的核心就是对模式的掌握和操作,理解了模式就等于拿到了开启大门的钥匙。

这里我介绍一个TCL语言中的命令:regsub,这个命令的作用就是利用正则表达式来获取想要的字符,它的使用方法如下:

regexp[选项]<正则表达式><匹配的原始字符串><保存匹配后字符串的变量>[其他保存子模式匹配字符串的变量]

上面regexp中用[]括起来的部分是可选的,其他<>括起来的部分是必须的,如果正则表达式匹配从原始字符串中匹配到了内容,则命令返回1并且将匹配到的内容<保存匹配后字符串的变量>中。下面我们来看1个简单的例子:

regexp{A+}"AABBCC"match

puts$match

AA

上面的puts命令用来打印match变量中的内容,A+这个模式从AABBCC这个原始字符串中匹配到了AA2个字符,并将它置于match这个变量中,这就是一个最基本的正则表达式使用过程。

正因为模式如此重要,下面的内容就要详细说明几个模式关键字的作用了:

()子模式匹配关键字

小括号用来将一个大模式分为几段更小的模式,这样就可以更加精细的控制匹配方式了,我们来看一个例子:

regexp -- {(AA)(BB)(CC)} "AABBCC" match sub1 sub2 sub3

puts "The match is:$match"

puts "The sub1 is:$sub1"

puts "The sub2 is:$sub2"

puts "The sub3 is:$sub3"

The match is:AABBCC

The sub1 is:AA

The sub2 is:BB

The sub3 is:CC

上面的例子中,处于{}之间的内容是一个完整的正则表达式,在正则表达式里面我们用()将表达式分为3个子模式,后面的match变量中保存所有已经匹配到的字符,而几个sub?变量则保存相应子模式中匹配到的字符。

|交替匹配关键字

交替匹配用来匹配|符号二边的一个模式,比如下面的例子:

TOPSEC|topsec

上面的表达式表示匹配要么是全部大写的TOPSEC,要么是全部小写的topsec,不能2个都同时匹配。

[]区间匹配

区间匹配用来表示匹配一系列字符串中间的一个,比如下面的例子:

regexp {[ADEFG]} "AAABBBCCC" match

puts $match

A

上面的表达式表示匹配ABCDE5个字符中的一个,注意:只是一个

如果想匹配多个呢?可以使用数量关键字辅助:

regexp {[ADEFG]+} "AAABBBCCC" match

puts $match

AAA

区间匹配还可以使用[a-z]这样的语法来表示匹配从小写a到小写z26个小写字母中的一个

这个关键字使用必须非常小心,因为在TCL语言中[]还有另外一个含义:所有处于[]中的内容是一条TCL命令,因此在regexp中使用的时候,必须用{}[]的其他含义取消掉,如果将{}换成"",那么上面的命令会报错。

^挂靠匹配,将模式挂靠在字符串的开头

这是一个很特殊的关键字,它不像其他关键字是作用于左边的模式上,而是作用于右边的模式上,千万注意这一点!它表示从要匹配的字符串的最前面开始匹配,我们来看一个比较的例子:

regexp{(AAA)}"BBBAAACCC"match

可以匹配到,match中的值是AAA,但是我们加上挂靠匹配字符之后呢:

regexp{^(AAA)}"BBBAAACCC"match


无法匹配,match中的值为空,因为^符号要求必须从要匹配的字符最前面开始匹配,可惜要匹配的字符最前面是BBB,所以无法匹配到。

^这个字符也有2义性,如果把它放在中括号里面的话,它表示【非】的意思,比如[^a-z]表示匹配不是a-z字母的其他字符,但是不在中括号里面,比如^ab表示必须最前面是ab这2个字符,这是很容易搞混的地方,一定要注意了。

$挂靠匹配,将模式挂靠在字符串的结尾

这个关键字与^关键字作用相反,但是它和其他关键字一样,是作用于左边的模式上,还是看看例子:

regexp{(AAA)$}"BBBCCCAAA"match

可以匹配到,因为要匹配的字符最后面是AAA,如果要匹配的字符是BBBAAACCC这样的,就无法匹配到了。

数量关键字:

.(点)*(星号)+(加号)?(问号)用来表示数量。

.匹配任意一个字符

.(点)是一个比较特殊的字符,它虽然表示匹配任意一个字符,但实际上任意字符也包括空字符。

*匹配前面模式中的零个或任意多个

零个这个概念很重要,也就是说不管有没有都会匹配,所以一般我们都会用.*这样的方式来表示任意多个任意字符,不管有没有都可以。

+匹配前面模式中的1个或任意多个


?匹配前面模式中的0个或1个

?号还有一个术语――非贪婪模式,这也是正则表达式中非常重要的内容,所谓非贪婪模式,就是表示只要匹配到第一个就会停下来,而贪婪模式正好相反,它会尽可能多的匹配,这2种模式的最终结果就是:非贪婪模式总是获得第一个匹配,贪婪模式总是获得最后一个匹配。默认情况下,正则表达式总是处于贪婪模式下的。

基本正则表达式中还有一个很重要的符号:\(反斜杠),它用来关闭上面这些特殊字符的特殊含义,比如:

\*表示一个星号本身

\+表示一个加号本身

\\表示一个反斜杠\(o(∩_∩)o...哈哈,自己关闭了自己)

在高级正则表达式中,反斜杠还有更多的用途。

后记,例如要匹配res中

index
version
avalibility
state
1
1.1
Yes
Active
2
1.2
Yes
No-Active

中Active的index

regsub{[1-2].*Active} $res info (中间任意多个字符)

正则表达式参考 TCL语言版收藏的更多相关文章

  1. HTML5数字输入仅接受整数的实现代码

    这篇文章主要介绍了HTML5数字输入仅接受整数的实现代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  2. ios – 使用大写符号在字符串swift中获取URL的正则表达式

    我尝试在文本中获取URL.所以,在此之前,我使用了这样一个表达式:但是当用户输入带有大写符号的URL时(例如Http://Google.com,它与它不匹配)我遇到了问题.我试过了:但什么都没发生.解决方法您可以使用正则表达式中的i内联标志关闭区分大小写,有关可用正则表达式功能的详细信息,请参阅FoundationFrameworkReference.(?ismwx-ismwx)Flagsetti

  3. ios – 如何在Swift 3中使用正则表达式?

    解决方法我相信.当没有其他选项适用时,将使用.allZeros.因此,使用Swift3,您可以传递一个空的选项列表或省略options参数,因为它默认为无选项:要么请注意,在Swift3中,您不再使用error参数.它现在抛出.

  4. ios – lldb断点在类目标c中的所有方法

    如何使用lldb在ObjectiveC类中的所有方法上自动设置断点?

  5. swift的正则表达式(NSRegularExpression)

    init(_pattern:String){varerror:NSError?

  6. swift 正则表达式运用实例选自《swifter 100个swift开发必备tip 》

  7. 可以匹配就匹配咯: 详解 Swift 的模式匹配

    怒戳查看最终稿@SwiftGG在众多Swift提供给Objective-C程序员使用的新特性中,有个特性把自己伪装成一个无聊的老头,但是却在如何优雅滴解决“鞭尸金字塔“的问题上有着巨大的潜力。很显然我所说的这个特性就是switch语句,对于很多Objective-C程序员来说,除了用在Duff’sDevice上比较有趣之外,switch语句非常笨拙,与多个if语句相比,它几乎没有任何优势。不过Sw

  8. Swift中的模式匹配

    模式是用于匹配的规则值,如switch语句的case,do语句的catch子句,以及if、while、guard、for-in语句的条件。例如,假设你想判断一个整数是大于、小于还是等于零,你可以用if-elseif-else语句,尽管这并不美观:letx=10ifx>0{print}elseifx原文查看:http://bbs.a-coder.cn/thread-7-1-1.html

  9. 《swift2.0 官方教程中文版》 第3章-05模式

    letpoint=(3,2)switchpoint{caselet(x,y):print}//prints"Thepointisat(3,2).”/*元组模式********************************************///元组模式是逗号分隔的,有零个或多个模式的列表,并被一对圆括号括起来。枚举用例模式出现在switch语句中的case标签中,以及if,while,guard和for-in语句的case条件中。is模式和is操作符有相似表现,它们都进行类型转换,却舍弃返回的类型

  10. 模式匹配第一弹: switch, enums &amp; where 子句

    本文作为模式匹配的第一篇介绍文章,旨在抛砖引玉。Switch基本用法Swift中最简单、最为常见的模式匹配就是switch语句,大家对下面的形式都比较熟悉了:但是switch可以更进一步,允许使用包含变量的匹配模式,并在匹配时绑定这些变量。下一部分的计划这篇文章很简单,带你回顾了swith中的一些基本的模式匹配,下一部分将探讨更高级的用法,包括:在enum之外的其他地方使用switch与其他语句一起配合使用模式匹配,包括ifcase,guardcase,forcase,=~,…

随机推荐

  1. 法国电话号码的正则表达式

    我正在尝试实施一个正则表达式,允许我检查一个号码是否是一个有效的法国电话号码.一定是这样的:要么:这是我实施的但是错了……

  2. 正则表达式 – perl分裂奇怪的行为

    PSperl是5.18.0问题是量词*允许零空间,你必须使用,这意味着1或更多.请注意,F和O之间的空间正好为零.

  3. 正则表达式 – 正则表达式大于和小于

    我想匹配以下任何一个字符:或=或=.这个似乎不起作用:[/]试试这个:它匹配可选地后跟=,或者只是=自身.

  4. 如何使用正则表达式用空格替换字符之间的短划线

    我想用正则表达式替换出现在带空格的字母之间的短划线.例如,用abcd替换ab-cd以下匹配字符–字符序列,但也替换字符[即ab-cd导致d,而不是abcd,因为我希望]我如何适应以上只能取代–部分?

  5. 正则表达式 – /bb | [^ b] {2} /它是如何工作的?

    有人可以解释一下吗?我在t-shirt上看到了这个:它似乎在说:“成为或不成为”怎么样?我好像没找到’e’?

  6. 正则表达式 – 在Scala中验证电子邮件一行

    在我的代码中添加简单的电子邮件验证,我创建了以下函数:这将传递像bob@testmymail.com这样的电子邮件和bobtestmymail.com之类的失败邮件,但是带有空格字符的邮件会漏掉,就像bob@testmymail也会返回true.我可能在这里很傻……当我测试你的正则表达式并且它正在捕捉简单的电子邮件时,我检查了你的代码并看到你正在使用findFirstIn.我相信这是你的问题.findFirstIn将跳转所有空格,直到它匹配字符串中任何位置的某个序列.我相信在你的情况下,最好使用unapp

  7. 正则表达式对小字符串的暴力

    在测试小字符串时,使用正则表达式会带来性能上的好处,还是会强制它们更快?不会通过检查给定字符串的字符是否在指定范围内比使用正则表达式更快来强制它们吗?

  8. 正则表达式 – 为什么`stoutest`不是有效的正则表达式?

    isthedelimiter,thenthematch-only-onceruleof?PATTERN?

  9. 正则表达式 – 替换..与.在R

    我怎样才能替换..我尝试过类似的东西:但它并不像我希望的那样有效.尝试添加fixed=T.

  10. 正则表达式 – 如何在字符串中的特定位置添加字符?

    我正在使用记事本,并希望使用正则表达式替换在字符串中的特定位置插入一个字符.例如,在每行的第6位插入一个逗号是什么意思?如果要在第六个字符后添加字符,请使用搜索和更换从技术上讲,这将用MatchGroup1替换每行的前6个字符,后跟逗号.

返回
顶部