我是shell脚本的新手。我想使用curl发送一个http请求,然后使用正则表达式提取一些字符串。例如,如何从HTTP响应中提取域名? (这个例子只是为了学习目的)
#!/bin/bash
name=$(curl google.com | grep "www\..*com")
echo "domain name is"
echo $name
使用 bash regular expressions:
re="http://([^/]+)/"
if [[ $name =~ $re ]]; then echo ${BASH_REMATCH[1]}; fi

编辑 – OP要求解释语法。 Regular expression syntax是一个很大的话题,我无法在这里全面解释,但我会尝试解释足够的理解这个例子。

re="http://([^/]+)/"

这是存储在bash变量中的正则表达式,即 – 您希望输入字符串匹配,并希望提取一个子字符串。打破它:

> http://只是一个字符串 – 输入字符串必须包含正则表达式匹配的这个子字符串
> []通常使用方括号表示“匹配括号内的任何字符”。所以c [ao] t将匹配“猫”和“婴儿床”。 []中的^字符修改为“匹配除方括号内的任何字符”,因此在这种情况下,[^ /]将匹配除“/”之外的任何字符。
>方括号表达式只匹配一个字符。添加到最后它说“匹配1个或更多的前一个子表达式”。所以[^ /]匹配一个或多个所有字符的集合,不包括“/”。
>在子表达式周围放置()括号表示您要保存与该子表达式匹配的任何后续处理。如果您使用的语言支持此功能,它将提供一些检索这些子匹配的机制。对于bash,它是BASH_REMATCH数组。
>最后,我们对“/”进行完全匹配,以确保我们匹配完全限定域名的所有方式和以下“/”

接下来,我们必须根据正则表达式测试输入字符串,看看它是否匹配。我们可以使用bash条件来做到这一点:

if [[ $name =~ $re ]]; then
    echo ${BASH_REMATCH[1]}
fi

在bash中,[[]]指定扩展条件测试,并且可以包含=〜bash正则表达式运算符。在这种情况下,我们测试输入字符串$ name是否与正则表达式$ re匹配。如果它匹配,那么由于正则表达式的构造,我们保证我们将有一个子匹配(从括号()),我们可以使用BASH_REMATCH数组访问它:

>该数组的元素0 $ {BASH_REMATCH [0]}将是正则表达式匹配的整个字符串,即“http://www.google.com/”。
>该数组的后续元素将是子匹配的后续结果。注意,您可以在正则表达式中有多个submatch() – BASH_REMATCH元素将按顺序对应于这些。所以在这种情况下,$ {BASH_REMATCH [1]}将包含“www.google.com”,我认为这是你想要的字符串。

请注意,BASH_REMATCH数组的内容只适用于上次使用正则表达式=〜operator的时候。所以如果你继续做更多的正则表达式匹配,你必须每次从这个数组保存你需要的内容。

这可能看起来像一个漫长的描述,但我真的掩盖了正则表达式的复杂性。他们可以是非常强大的,我相信体面的表现,但正则表达式语法是复杂的。正则表达式实现也有所不同,因此不同的语言将支持不同的功能,并且可能在语法上有微妙的差异。特别是正则表达式中的字符的转义可能是一个棘手的问题,特别是当这些字符在给定语言中具有其他不同的含义时。

请注意,不必在单独的行上设置$ re变量,而是在条件中引用此变量,您可以将正则表达式直接置于条件中。然而在bash 3.2,关于是否需要这种文字正则表达式的引号,这些规则被改变了。将正则表达式放在一个单独的变量中是一个简单的方法,这样就可以在所有支持=〜match运算符的bash版本中按预期运行。

正则表达式 – shell脚本 如何使用正则表达式提取字符串的更多相关文章

  1. Html5 canvas实现粒子时钟的示例代码

    这篇文章主要介绍了Html5 canvas实现粒子时钟的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

  2. HTML5数字输入仅接受整数的实现代码

    这篇文章主要介绍了HTML5数字输入仅接受整数的实现代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  3. ios – 使用大写符号在字符串swift中获取URL的正则表达式

    我尝试在文本中获取URL.所以,在此之前,我使用了这样一个表达式:但是当用户输入带有大写符号的URL时(例如Http://Google.com,它与它不匹配)我遇到了问题.我试过了:但什么都没发生.解决方法您可以使用正则表达式中的i内联标志关闭区分大小写,有关可用正则表达式功能的详细信息,请参阅FoundationFrameworkReference.(?ismwx-ismwx)Flagsetti

  4. 在Xcode4中,你可以更改用于显示隐形字符的字符吗?

    我更喜欢VisualStudio显示隐形的方式……

  5. ios – 应用程序商店描述特殊字符

    是不是可以在AppStore描述中使用像星星这样的特殊字符了?我得到这个错误:描述不得包含标记语言.说明不得包含以下字符:★提前致谢:)解决方法仍然允许一些unicode字符.以下字符已经过测试并仍然有效:◆√至于现在他们工作正常,但苹果可以随时再次改变条件.

  6. ios – 将数组中的字符转换为整数

    即使我搜索了文档,我似乎无法弄清楚如何做到这一点.我试图弄清楚如何将数组中索引处的字符转换为整数.例如,假设我有一个名为“容器”的字符数组,我无法弄清楚该怎么做:谢谢您的帮助!解决方法Swift并不容易在原始和类型表示之间进行转换.这是一个在此期间应该有所帮助的扩展:这使您可以非常接近您想要的:对于遇到此问题的任何工程师,请参阅rdar://17494834

  7. 为什么PATH不适用于从Xcode执行的自定义shell脚本?

    我观察到Xcode在运行脚本阶段执行的自定义shell脚本没有设置任何环境变量.他们有很多其他变量,但不是PATH.有可能解决这个问题,怎么样?我只想运行一个应该在路径中的工具,我不想开始手动检查可能的位置.解决方法你可以明确地找到用户.bashrc,.profile等.或者更好的是,运行类似的东西这不会有污染其他变量的风险.

  8. ios – Xcode Server 4.0 git从构建触发脚本推送

    我为一个托管在github上的项目安装了一个XcodeBot.我按照步骤和设置机器人来使用我现有的SSH密钥.验证成功,项目结算和建立.然后,我在预触发器操作中添加了一个shell脚本,它增加了plist中的版本,将其标记,并将该更改提交到github.但是当我尝试从shell脚本执行gitpush时,我得到:–推送到git@github.com:spex-app/spex-ios.git权限被拒

  9. ios – 如何在Swift 3中使用正则表达式?

    解决方法我相信.当没有其他选项适用时,将使用.allZeros.因此,使用Swift3,您可以传递一个空的选项列表或省略options参数,因为它默认为无选项:要么请注意,在Swift3中,您不再使用error参数.它现在抛出.

  10. ios – lldb断点在类目标c中的所有方法

    如何使用lldb在ObjectiveC类中的所有方法上自动设置断点?

随机推荐

  1. 法国电话号码的正则表达式

    我正在尝试实施一个正则表达式,允许我检查一个号码是否是一个有效的法国电话号码.一定是这样的:要么:这是我实施的但是错了……

  2. 正则表达式 – perl分裂奇怪的行为

    PSperl是5.18.0问题是量词*允许零空间,你必须使用,这意味着1或更多.请注意,F和O之间的空间正好为零.

  3. 正则表达式 – 正则表达式大于和小于

    我想匹配以下任何一个字符:或=或=.这个似乎不起作用:[/]试试这个:它匹配可选地后跟=,或者只是=自身.

  4. 如何使用正则表达式用空格替换字符之间的短划线

    我想用正则表达式替换出现在带空格的字母之间的短划线.例如,用abcd替换ab-cd以下匹配字符–字符序列,但也替换字符[即ab-cd导致d,而不是abcd,因为我希望]我如何适应以上只能取代–部分?

  5. 正则表达式 – /bb | [^ b] {2} /它是如何工作的?

    有人可以解释一下吗?我在t-shirt上看到了这个:它似乎在说:“成为或不成为”怎么样?我好像没找到’e’?

  6. 正则表达式 – 在Scala中验证电子邮件一行

    在我的代码中添加简单的电子邮件验证,我创建了以下函数:这将传递像bob@testmymail.com这样的电子邮件和bobtestmymail.com之类的失败邮件,但是带有空格字符的邮件会漏掉,就像bob@testmymail也会返回true.我可能在这里很傻……当我测试你的正则表达式并且它正在捕捉简单的电子邮件时,我检查了你的代码并看到你正在使用findFirstIn.我相信这是你的问题.findFirstIn将跳转所有空格,直到它匹配字符串中任何位置的某个序列.我相信在你的情况下,最好使用unapp

  7. 正则表达式对小字符串的暴力

    在测试小字符串时,使用正则表达式会带来性能上的好处,还是会强制它们更快?不会通过检查给定字符串的字符是否在指定范围内比使用正则表达式更快来强制它们吗?

  8. 正则表达式 – 为什么`stoutest`不是有效的正则表达式?

    isthedelimiter,thenthematch-only-onceruleof?PATTERN?

  9. 正则表达式 – 替换..与.在R

    我怎样才能替换..我尝试过类似的东西:但它并不像我希望的那样有效.尝试添加fixed=T.

  10. 正则表达式 – 如何在字符串中的特定位置添加字符?

    我正在使用记事本,并希望使用正则表达式替换在字符串中的特定位置插入一个字符.例如,在每行的第6位插入一个逗号是什么意思?如果要在第六个字符后添加字符,请使用搜索和更换从技术上讲,这将用MatchGroup1替换每行的前6个字符,后跟逗号.

返回
顶部