我试图找出一种方法来检查数组中值的存在,而不遍历数组。
我正在读取一个文件的参数。我有一长串不想处理的参数。我把这些不需要的参数放在一个数组@badparams中。
我想读取一个新的参数,如果它不存在于@badparams,处理它。如果@badparams中存在,请转到下一次读取。
我试图找出一种方法来检查数组中值的存在,而不遍历数组。
我正在读取一个文件的参数。我有一长串不想处理的参数。我把这些不需要的参数放在一个数组@badparams中。
我想读取一个新的参数,如果它不存在于@badparams,处理它。如果@badparams中存在,请转到下一次读取。
当前回答
最佳通用-特别是短数组(1000项或更少)和不确定哪种优化最适合他们的需求的编码员。
# $value can be any regex. be safe
if ( grep( /^$value$/, @array ) ) {
print "found it";
}
前面提到过,即使数组中的第一个值匹配,grep也会遍历所有值。这是事实,但是grep在大多数情况下仍然非常快。如果你谈论的是短数组(少于1000项),那么大多数算法无论如何都会非常快。如果您谈论的是非常长的数组(1,000,000个项),无论项是数组中的第一个、中间还是最后一个,grep都是可以接受的。
更长的数组优化案例:
如果你的数组是排序的,使用“二分搜索”。
如果重复搜索同一数组多次,则先将其复制到哈希中,然后再检查哈希。如果内存是一个问题,那么将每个项从数组移动到散列中。内存效率更高,但会破坏原始数组。
如果在数组中重复搜索相同的值,则惰性地构建缓存。(在搜索每个项时,首先检查搜索结果是否存储在持久散列中。如果在哈希中没有找到搜索结果,则搜索数组并将结果放入持久哈希中,以便下次在哈希中找到它并跳过搜索)。
注意:这些优化只会在处理长数组时更快。不要过度优化。
其他回答
简单地将数组转换为哈希:
my %params = map { $_ => 1 } @badparams;
if(exists($params{$someparam})) { ... }
你也可以添加更多(唯一的)参数到列表中:
$params{$newparam} = 1;
然后返回一个(唯一的)参数列表:
@badparams = keys %params;
这里肯定需要一个哈希。将坏的参数作为键放在散列中,然后决定某个特定参数是否存在于散列中。
our %bad_params = map { $_ => 1 } qw(badparam1 badparam2 badparam3)
if ($bad_params{$new_param}) {
print "That is a bad parameter\n";
}
如果您真的对数组感兴趣,请查看List::Util或List::MoreUtils
方法1:grep(可能小心,而值是一个正则表达式)。
如果查看资源,尽量避免使用grep。
if ( grep( /^$value$/, @badparams ) ) {
print "found";
}
方法二:线性搜索
for (@badparams) {
if ($_ eq $value) {
print "found";
last;
}
}
方法3:使用散列
my %hash = map {$_ => 1} @badparams;
print "found" if (exists $hash{$value});
方法四:smartmatch
(在Perl 5.10中添加,在Perl 5.18中标记为实验性)。
use experimental 'smartmatch'; # for perl 5.18
print "found" if ($value ~~ @badparams);
方法5:使用List::MoreUtils模块
use List::MoreUtils qw(any);
@badparams = (1,2,3);
$value = 1;
print "found" if any {$_ == $value} @badparams;
最佳通用-特别是短数组(1000项或更少)和不确定哪种优化最适合他们的需求的编码员。
# $value can be any regex. be safe
if ( grep( /^$value$/, @array ) ) {
print "found it";
}
前面提到过,即使数组中的第一个值匹配,grep也会遍历所有值。这是事实,但是grep在大多数情况下仍然非常快。如果你谈论的是短数组(少于1000项),那么大多数算法无论如何都会非常快。如果您谈论的是非常长的数组(1,000,000个项),无论项是数组中的第一个、中间还是最后一个,grep都是可以接受的。
更长的数组优化案例:
如果你的数组是排序的,使用“二分搜索”。
如果重复搜索同一数组多次,则先将其复制到哈希中,然后再检查哈希。如果内存是一个问题,那么将每个项从数组移动到散列中。内存效率更高,但会破坏原始数组。
如果在数组中重复搜索相同的值,则惰性地构建缓存。(在搜索每个项时,首先检查搜索结果是否存储在持久散列中。如果在哈希中没有找到搜索结果,则搜索数组并将结果放入持久哈希中,以便下次在哈希中找到它并跳过搜索)。
注意:这些优化只会在处理长数组时更快。不要过度优化。
尽管使用起来很方便,但转换为哈希的解决方案似乎消耗了相当多的性能,这对我来说是个问题。
#!/usr/bin/perl
use Benchmark;
my @list;
for (1..10_000) {
push @list, $_;
}
timethese(10000, {
'grep' => sub {
if ( grep(/^5000$/o, @list) ) {
# code
}
},
'hash' => sub {
my %params = map { $_ => 1 } @list;
if ( exists($params{5000}) ) {
# code
}
},
});
基准测试输出:
Benchmark: timing 10000 iterations of grep, hash...
grep: 8 wallclock secs ( 7.95 usr + 0.00 sys = 7.95 CPU) @ 1257.86/s (n=10000)
hash: 50 wallclock secs (49.68 usr + 0.01 sys = 49.69 CPU) @ 201.25/s (n=10000)