一、正则表达式的定义

就是以行为单位处理字符串的方式。


1. 元字符:不表示字符本身的意义,用于额外功能性的描述。

1)字符匹配:

.:匹配任意单个字符

[]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符

[:digit:]:代表数字,既0-9
[:alnum:]:代表代表英文大小写字符及数字,即a-z,A-Z,0-9
[:alpha:]:代表代表英文大小写字符a-z,A-Z
[:cntrl:]:代表键盘上的控制按键,
[:graph:]:除了空格符(空格和[tab]键)以外的
[:print:]:代表任何可以打印出来的字符
[:punct:]:代表标点符号
[:upper:]:代表大写字符即A-Z
[:space:]:代表可以产生空白的字符
[:xdigit:]:代表16进制的数字类型,包括0-9,A-F,a-f

2)次数匹配

* :匹配任意次 如:x*y: xxy xy y

.*:匹配任意长度的任意字符,0次或多次。

\?:匹配0次或1次 如:x\?y: xy y xxy

xxy是匹配了x 2次,这也能行?当然,因为,grep有贪婪模式,尽可能长的去匹配字符。

\{m\}:匹配m次 这里的\代表转义字符,扩展正则表达式中不用

\{m,n\}:匹配最少m次,最多n次

ottom:0px;clear:both;height:auto;color:rgb(44,\}:匹配至少m次

\{0,n\}:匹配至多n次

3)位置锚定: 用于指定字符出现的位置

^:托字符,锚定行首 ^char

$:锚定行尾 char$

^$:空白行 既是行首,又是行尾,当然就是空白行了

\<:锚定词首 \<char \bchar 这里的\依然是转义

\>:锚定词尾 char\> char\b

\<hello\>:既锚定词首又锚定词尾,当然是锚定hello这个单词。

4)分组

\(\) \给括号转义 用与后面的引用使用。

5)引用

\1:前向引用,引用前面的第1个左括号以及与之对应的右括号中的模式所匹配到的内容 \(a.b\)xy\1 --> a6bxya6b

\2:前向引用,引用前面的第2个左括号以及与之对应的右括号中的模式所匹配到的内容

二、相关常用命令:


1.grep:

功能:文本搜索工具,以行为单位进行字符串数据对比,将符合要求的打印出来。


格式:grep [options] 'PATTERN' file,简单理解:直接命令+'PATTERN'+文件

常用选项:

-v:反向匹配,显示不能被模式所匹配到的行。

-o:仅显示被模式匹配到的字串,而非整行。

-i:不区分大小写,ignore-case

-E:支持扩展正则表达式,Expand

-A:显示匹配行及下一行,after

-B:显示匹配行及上一行,befoe

--color=auto 匹配到的高亮度显示。

2. egrep 扩展正则表达式

功能和用法和grep一样,,只是在扩展正则表达式中不需要转义符\

eg:

3)锚定:

^:锚定行首

$:锚定行尾

4)分组:

():

| :或者 基本正则表达式中没有|

5)引用:

\1:前向引用,引用前面的第1个左括号以及与之对应的右括号中的模式所匹配到的内容

3.fgrep

命令是用来查找一个或多个与给出的字符串或词组相匹配文件中的行。fgrep 查询速度比grep命令快,但是不够灵活:它只能找固定的文本,而不是规则表达式。

-b:在找到的每行之前添加行所在的块编号。使用此标志有助于按照上下文查找磁盘块号码。

-c:仅显示匹配行的计数。

-e 模式:指定模式。这个工作模式很简单,但当此模式以 a-(减号) 开头时却是很有用的。

-f StringFile:指定包含字符串的文件。

此命令返回以下出口值: 0 找到匹配项。 1 未找到匹配项。 >1 发现语法错误,或者文件不可访问(即使找到了匹配项)。



4. sed 行编辑器 一次只读一行


处理机制:按换行符截取,从文件中一次只读取一行。 把文件加载到内存特定空间(模式空间)之后,由sed命令从内存缓冲区当中一次加载一行出来,并进行编辑,编辑完放到屏幕上。

用法:

sed [options] 'addr1[,addr2]编辑命令' FILE ...

sed [options] “addr1[,addr2]编辑命令” FILE ... 做变量替换用的。


选项(option):

-n: 静默模式,不输出模式空间中的内容;

-r: 扩展的正则表达式

-f /path/to/sed_script_file: 指定sed脚本文件

-e 'script' -e 'script': 指定多个编辑指令

-i: 直接编辑原文件

编辑命令:

d: 删除

p: 打印

i \text: 添加 之前添加

a \text: 之后添加

r /path/to/somefile: 在指定位置把另外一个文件的内容插入进来

w /path/to/somefile:将符合条件的所有行保存至指定的文件中

=:显示符合条件的行的行号

s///: 查找条件可以使用模式,但要替换的内容不行

s/查找内容/替换内容/

地址定界:

/pat1/,/pat2/ 从第一个符合模式行开始到第一个符合模式2的行结束。


sed常用命令:sed '地址定界s@查找条件@替换文本@'

修饰符:

g: global,全局替换

i: ignore-case,不区分字符大小写

eg:

1、替换/etc/inittab文件中“id:3:initdefault:”一行中的数字为5;

# sed 's@\(id:\)[0-9]\(:initdefault\)@\15\2' /etc/inittab


5.awk

awk仅仅是将读进来的内容进行过滤显示, 所以是一个过滤显示工具。目的是为了生成一个美观的结果。且结果是可以指定现实的。

1用法: awk [options] 'script' FILE ...

awk [options] '/pattern/{action}' FILE ...

action: print $1,$1

默认分隔符是空白,

-F 指定分隔符:

eg: # awk -F : '$3<500{print $1}' /etc/group 指定的分隔符位:

2.awk的常用四种分隔符:

输入:

行分隔符

字段分隔符

输出:

行分隔符

字段分隔符

awk的内置变量:

NF:字段数 (所以$NF表示最后一个字符。)

FS: 读入行时使用的字段分隔符,默认为空白

OFS: 输出时使用字段分隔符,默认为空白



三、实战:

1. grep:

1,取出默认shell为非bash的用户;

wKioL1SSgWCTQUgRAACEasjsPMc897.jpg

2,取出默认shell为bash的且其ID号最大的用户;

wKiom1SSgM-CQM4hAADGaiSRsfM073.jpg

3、grep配合其它命令的用法,找出本机的IP地址,只显示IP段(管道、cut)

wKioL1SSg-uj08sTAAEMxriQd0w573.jpg


2.egrep

显示/boot/grub/grub.conf中以至少一个空白符开头的行


wKiom1SShlfT3iLlAAEe-kHIY9A398.jpg

3. sed


1 删除以#开头的所有# 。 (这里^#必须用双斜线扩住。)

[root@xiaoxiao ~]# sed '/^#/d' /etc/fstab

2.删除以\开头必须用转义符

# sed '/^\//d' /etc/fstab

3 给以#开头的后面的下一行加一句hello



wKiom1SSjfLDtGpgAAGN8nLQIuQ065.jpg


4.删除/boot/grub/grub.conf文件中行首的空白字符;

# sed 's@^[[:space:]]\{1,\}@@' /boot/grub/grub.conf

5.取出一个文件路径的目录名称,如/etc/sysconfig/network,其目录为/etc/sysconfig,功能类似dirname命令;

# echo /etc/sysconfig/network-scripts/ifcfg-eth0/ | sed 's@[^/]\{1,\}/\?$@@'

(以非斜杠开始,后面的斜杠可有可无,用空格替换)


4.awd

1、显示GID小于500的组;

# awk -F : '$3<500{print $1}' /etc/group

2.显示/etc/sysctl.conf文件中定义的内核参数;只显示名称;

wKiom1SSlOiS3_AzAAEbZvW1QaY487.jpg

3.显示eth0网卡的ip地址;通过ifconfig的命令结果进行过滤



wKiom1SSltTQ_z99AAH7HpUeUyU378.jpg

正则表达式――grep, sed,awd的更多相关文章

  1. Html5 canvas实现粒子时钟的示例代码

    这篇文章主要介绍了Html5 canvas实现粒子时钟的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

  2. HTML5数字输入仅接受整数的实现代码

    这篇文章主要介绍了HTML5数字输入仅接受整数的实现代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  3. UITableViewCellAccessoryCheckmark涵盖iOS 7上的单元格分隔符

    在iOS7上使用此代码会导致分隔符视图被覆盖或缩短:如何修复分隔符视图?

  4. ios – 使用大写符号在字符串swift中获取URL的正则表达式

    我尝试在文本中获取URL.所以,在此之前,我使用了这样一个表达式:但是当用户输入带有大写符号的URL时(例如Http://Google.com,它与它不匹配)我遇到了问题.我试过了:但什么都没发生.解决方法您可以使用正则表达式中的i内联标志关闭区分大小写,有关可用正则表达式功能的详细信息,请参阅FoundationFrameworkReference.(?ismwx-ismwx)Flagsetti

  5. 在Xcode4中,你可以更改用于显示隐形字符的字符吗?

    我更喜欢VisualStudio显示隐形的方式……

  6. ios – 页脚视图的颜色总是比UITableView分隔符的颜色更暗

    在我的UITableView中,我设置了这样的分隔符颜色:我像这样设置页脚的颜色:但是,页脚视图的颜色总是比分隔符的颜色更暗,如下所示:如何让它们成为完全相同的颜色?谢谢.解决方法从iOS6.0开始,您可以使用下面提到的UITableView的委托方法来更改页脚视图的背景颜色–

  7. ios – 使用NSLayoutConstraint垂直居中两个视图

    解决方法通过这样做,我能够做到这一点:棘手的部分是恒定值.该值是所有视图高度的一半,包括它们的分隔符.这意味着,如果imageview的高度为360,按钮的高度为70,分隔符为60,则该常量将为/2=245.确实应该有一种更聪明的方式,但是现在我觉得这没关系.

  8. ios – 如何识别显示为空括号的空NSData对象?

    我正在处理GameKit的GKTurnBasedMatch类中的损坏问题(参见thisthread),这有时会导致游戏状态无效,matchData损坏.因此,作为一种解决方法,我正在创建一种方法来识别这些无效匹配,以便我可以适当地处理它们.损坏的matchData似乎是一种很好的方法.但是,到目前为止,我一直无法识别它们.当我这样做:我得到以下内容:所以匹配数据显示为一对空括号“”,我希望可以

  9. ios – 应用程序商店描述特殊字符

    是不是可以在AppStore描述中使用像星星这样的特殊字符了?我得到这个错误:描述不得包含标记语言.说明不得包含以下字符:★提前致谢:)解决方法仍然允许一些unicode字符.以下字符已经过测试并仍然有效:◆√至于现在他们工作正常,但苹果可以随时再次改变条件.

  10. ios – 将数组中的字符转换为整数

    即使我搜索了文档,我似乎无法弄清楚如何做到这一点.我试图弄清楚如何将数组中索引处的字符转换为整数.例如,假设我有一个名为“容器”的字符数组,我无法弄清楚该怎么做:谢谢您的帮助!解决方法Swift并不容易在原始和类型表示之间进行转换.这是一个在此期间应该有所帮助的扩展:这使您可以非常接近您想要的:对于遇到此问题的任何工程师,请参阅rdar://17494834

随机推荐

  1. 法国电话号码的正则表达式

    我正在尝试实施一个正则表达式,允许我检查一个号码是否是一个有效的法国电话号码.一定是这样的:要么:这是我实施的但是错了……

  2. 正则表达式 – perl分裂奇怪的行为

    PSperl是5.18.0问题是量词*允许零空间,你必须使用,这意味着1或更多.请注意,F和O之间的空间正好为零.

  3. 正则表达式 – 正则表达式大于和小于

    我想匹配以下任何一个字符:或=或=.这个似乎不起作用:[/]试试这个:它匹配可选地后跟=,或者只是=自身.

  4. 如何使用正则表达式用空格替换字符之间的短划线

    我想用正则表达式替换出现在带空格的字母之间的短划线.例如,用abcd替换ab-cd以下匹配字符–字符序列,但也替换字符[即ab-cd导致d,而不是abcd,因为我希望]我如何适应以上只能取代–部分?

  5. 正则表达式 – /bb | [^ b] {2} /它是如何工作的?

    有人可以解释一下吗?我在t-shirt上看到了这个:它似乎在说:“成为或不成为”怎么样?我好像没找到’e’?

  6. 正则表达式 – 在Scala中验证电子邮件一行

    在我的代码中添加简单的电子邮件验证,我创建了以下函数:这将传递像bob@testmymail.com这样的电子邮件和bobtestmymail.com之类的失败邮件,但是带有空格字符的邮件会漏掉,就像bob@testmymail也会返回true.我可能在这里很傻……当我测试你的正则表达式并且它正在捕捉简单的电子邮件时,我检查了你的代码并看到你正在使用findFirstIn.我相信这是你的问题.findFirstIn将跳转所有空格,直到它匹配字符串中任何位置的某个序列.我相信在你的情况下,最好使用unapp

  7. 正则表达式对小字符串的暴力

    在测试小字符串时,使用正则表达式会带来性能上的好处,还是会强制它们更快?不会通过检查给定字符串的字符是否在指定范围内比使用正则表达式更快来强制它们吗?

  8. 正则表达式 – 为什么`stoutest`不是有效的正则表达式?

    isthedelimiter,thenthematch-only-onceruleof?PATTERN?

  9. 正则表达式 – 替换..与.在R

    我怎样才能替换..我尝试过类似的东西:但它并不像我希望的那样有效.尝试添加fixed=T.

  10. 正则表达式 – 如何在字符串中的特定位置添加字符?

    我正在使用记事本,并希望使用正则表达式替换在字符串中的特定位置插入一个字符.例如,在每行的第6位插入一个逗号是什么意思?如果要在第六个字符后添加字符,请使用搜索和更换从技术上讲,这将用MatchGroup1替换每行的前6个字符,后跟逗号.

返回
顶部