如何在没有正则表达式的情况下在C中实现有效的全字符串替换？

2020-07-09 原文

也许我忽略了一些明显的东西,但我想知道在C中实现全字串替换的最快方法是什么.起初我考虑简单地将空格连接到搜索词,但这不考虑字符串边界或标点符号.

这是我目前对(非全字)替换的抽象：

void Replace(wstring& input,wstring find,wstring replace_with) {
  if (find.empty() || find == replace_with || input.length() < find.length()) {
      return;
  }
  for (size_t pos = input.find(find); 
              pos != wstring::npos; 
              pos = input.find(find,pos)) {

      input.replace(pos,find.length(),replace_with);
      pos += replace_with.length();
  }
}

如果我只考虑空格作为单词边界,我可以通过比较搜索字符串的开头和结尾与查找字符串来覆盖字符串边界,然后用一个替换(L”找到L”)来实现这一点. ….但我想知道是否有一个更优雅的解决方案,有效地包括标点符号.

让我们考虑一个单词是由空格或标点符号分隔的任何字符集合(为了保持简单,让我们说吧！“#$％&'(*),– ./ at minimal – 恰好对应于( c> 31&& c< 48)). 在我的应用程序中,我必须在一个相当大的短字符串数组上调用此函数,其中可能包含各种Unicode,我不想拆分新单词.我还想避免包含任何外部库,但STL很好. 不使用正则表达式的目的是减少开销的承诺,以及适合于在大型数据集上执行此特定任务的快速函数的目标.

我认为你可以这样做,既可以进行全字匹配,又可以有效地进行.关键是：

>使用’std :: isalpha’检测“全字”边界,这应该与Unicode&任何语言环境.
>通过创建一个单独的“输出”字符串替换“out of place”,在处理结束时将其与“input”交换,而不是在“input”字符串本身上“就地”完成工作.

这是我对你的功能的看法：

#include <cctype> // isalpha
#include <ciso646> // or,not
#include <string> // wstring

using std::size_t;
using std::wstring;

/// @brief Do a "find and replace" on a string.
/// @note This function does "whole-word" matching.
/// @param[in,out] input_string The string to operate on.
/// @param[in] find_string The string to find in the input.
/// @param[in] replace_string The string to replace 'find_string'
///            with in the input.
void find_and_replace( wstring& input_string,const wstring& find_string,const wstring& replace_string )
{
  if( find_string.empty()
      or find_string == replace_string
      or input_string.length() < find_string.length() )
  {
    return;
  }

  wstring output_string;
  output_string.reserve( input_string.length() );
  size_t last_pos = 0u;
  for( size_t new_pos = input_string.find( find_string );
       new_pos != wstring::npos;
       new_pos = input_string.find( find_string,new_pos ) )
  {
    bool did_replace = false;
    if( ( new_pos == 0u
          or not std::isalpha( input_string.at( new_pos - 1u ) ) )
        and ( new_pos + find_string.length() == input_string.length()
              or not std::isalpha( input_string.at( new_pos + find_string.length() ) ) ) )
    {
      output_string.append( input_string,last_pos,new_pos - last_pos );
      output_string.append( replace_string );
      did_replace = true;
    }
    new_pos += find_string.length();
    if( did_replace )
    {
      last_pos = new_pos;
    }
  }
  output_string.append( input_string,input_string.length() - last_pos );

  input_string.swap( output_string );
}

附：我不确定’replace_all’在你的初始例子中试图完成什么,所以为了清楚起见,我把它从我的解决方案中删除了.

P.P.S.使用Regex-es,这段代码会更清晰.你能依靠C TR1或C 2011功能吗？它们提供标准的“正则表达式”库.

如何在没有正则表达式的情况下在C中实现有效的全字符串替换？的更多相关文章

HTML5 input新增type属性color颜色拾取器的实例代码

type 属性规定 input 元素的类型。本文较详细的给大家介绍了HTML5 input新增type属性color颜色拾取器的实例代码，感兴趣的朋友跟随脚本之家小编一起看看吧
移动HTML5前端框架—MUI的使用

这篇文章主要介绍了移动HTML5前端框架—MUI的使用的相关资料，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
使用placeholder属性设置input文本框的提示信息

这篇文章主要介绍了使用placeholder属性设置input文本框的提示信息,本文给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
Bootstrap File Input文件上传组件

这篇文章主要介绍了Bootstrap File Input文件上传组件,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
HTML5数字输入仅接受整数的实现代码

这篇文章主要介绍了HTML5数字输入仅接受整数的实现代码,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
HTML5 WebSocket实现点对点聊天的示例代码

这篇文章主要介绍了HTML5 WebSocket实现点对点聊天的示例代码的相关资料,小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
HTML5中input输入框默认提示文字向左向右移动的示例代码

这篇文章主要介绍了HTML5中input输入框默认提示文字向左向右移动，本文通过实例代码给大家介绍的非常详细对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
ios – 在Swift的UIView中找到UILabel

我正在尝试在我的UIViewControllers的超级视图中找到我的UILabels.这是我的代码：这是在Objective-C中推荐的方式,但是在Swift中我只得到UIViews和CALayer.我肯定在提供给这个方法的视图中有UILabel.我错过了什么？我的UIViewController中的调用：解决方法使用函数式编程概念可以更轻松地实现这一目标.
ios – 在Swift中将输入字段字符串转换为Int

所以我非常擅长制作APP广告Swift,我试图在文本字段中做一些非常简单的输入,取值,然后将它们用作Int进行某些计算.但是’vardistance’有些东西不正确它是导致错误的最后一行代码.它说致命错误：无法解开Optional.None解决方法在你的例子中,距离是一个Int？否则称为可选的Int..toInt()返回Int？因为从String到Int的转换可能失败.请参阅以下示例：
如何在iOS中检测文本(字符串)语言？

例如,给定以下字符串：我想检测每个声明的字符串中使用的语言.让我们假设已实现函数的签名是：如果没有检测到语言,则返回可选字符串.因此,适当的结果将是：有一个简单的方法来实现它吗？

随机推荐

法国电话号码的正则表达式

我正在尝试实施一个正则表达式,允许我检查一个号码是否是一个有效的法国电话号码.一定是这样的：要么：这是我实施的但是错了……
正则表达式 – perl分裂奇怪的行为

PSperl是5.18.0问题是量词*允许零空间,你必须使用,这意味着1或更多.请注意,F和O之间的空间正好为零.
正则表达式 – 正则表达式大于和小于

我想匹配以下任何一个字符：或=或=.这个似乎不起作用：[/]试试这个：它匹配可选地后跟=,或者只是=自身.
如何使用正则表达式用空格替换字符之间的短划线

我想用正则表达式替换出现在带空格的字母之间的短划线.例如,用abcd替换ab-cd以下匹配字符–字符序列,但也替换字符[即ab-cd导致d,而不是abcd,因为我希望]我如何适应以上只能取代–部分？
正则表达式 – /bb | [^ b] {2} /它是如何工作的？

有人可以解释一下吗？我在t-shirt上看到了这个：它似乎在说：“成为或不成为”怎么样？我好像没找到’e’？
正则表达式 – 在Scala中验证电子邮件一行

在我的代码中添加简单的电子邮件验证,我创建了以下函数：这将传递像bob@testmymail.com这样的电子邮件和bobtestmymail.com之类的失败邮件,但是带有空格字符的邮件会漏掉,就像bob@testmymail也会返回true.我可能在这里很傻……当我测试你的正则表达式并且它正在捕捉简单的电子邮件时,我检查了你的代码并看到你正在使用findFirstIn.我相信这是你的问题.findFirstIn将跳转所有空格,直到它匹配字符串中任何位置的某个序列.我相信在你的情况下,最好使用unapp
正则表达式对小字符串的暴力

在测试小字符串时,使用正则表达式会带来性能上的好处,还是会强制它们更快？不会通过检查给定字符串的字符是否在指定范围内比使用正则表达式更快来强制它们吗？
正则表达式 – 为什么`stoutest`不是有效的正则表达式？

isthedelimiter,thenthematch-only-onceruleof?PATTERN?
正则表达式 – 替换..与.在R

我怎样才能替换..我尝试过类似的东西：但它并不像我希望的那样有效.尝试添加fixed=T.
正则表达式 – 如何在字符串中的特定位置添加字符？

我正在使用记事本,并希望使用正则表达式替换在字符串中的特定位置插入一个字符.例如,在每行的第6位插入一个逗号是什么意思？如果要在第六个字符后添加字符,请使用搜索和更换从技术上讲,这将用MatchGroup1替换每行的前6个字符,后跟逗号.