我注意到我的Ruby(1.9)脚本中存在一些极端延迟,经过一些挖掘后,它归结为正则表达式匹配。我在Perl和Ruby中使用以下测试脚本:
Perl的:
$fname = shift(@ARGV);
open(FILE,"<$fname" );
while (<FILE>) {
if ( /(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/ ) {
print "$1: $2\n";
}
}
红宝石:
f = File.open( ARGV.shift )
while ( line = f.gets )
if /(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/.match(line)
puts "#{$1}: #{$2}"
end
end
我对两个脚本使用相同的输入,一个只有44290行的文件。
每个人的时间安排是:
Perl的:
xenofon@cpm:~/bin/local/project$ time ./try.pl input >/dev/null real 0m0.049s user 0m0.040s sys 0m0.000s
红宝石:
xenofon@cpm:~/bin/local/project$ time ./try.rb input >/dev/null real 1m5.106s user 1m4.910s sys 0m0.010s
我想我正在做一些非常愚蠢的事情,有什么建议吗?
谢谢
regex = Regexp.new(/(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/)
f = File.open( ARGV.shift ).each do |line|
if regex .match(line)
puts "#{$1}: #{$2}"
end
end
要么
regex = Regexp.new(/(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/)
f = File.open( ARGV.shift )
f.each_line do |line|
if regex.match(line)
puts "#{$1}: #{$2}"
end