当范围由变量给定时,如何在Bash中迭代一系列数字?

我知道我可以做到这一点(在Bash文档中称为“序列表达式”):

 for i in {1..5}; do echo $i; done

这给出了:

1.2.3.4.5.

然而,如何用变量替换任意一个范围端点?这不起作用:

END=5
for i in {1..$END}; do echo $i; done

哪些打印:

{1..5}


您可以使用

for i in $(seq $END); do echo $i; done

for i in $(seq 1 $END); do echo $i; done

编辑:比起其他方法,我更喜欢seq,因为我能记住它;)


这在bash中运行良好:

END=5
i=1 ; while [[ $i -le $END ]] ; do
    echo $i
    ((i = i + 1))
done

讨论

正如加亚罗所建议的那样,使用seq是可以的。Pax Diablo建议使用Bash循环来避免调用子进程,如果$END太大,则具有更友好内存的额外优势。Zathur发现了循环实现中的一个典型错误,并暗示,由于i是一个文本变量,所以在执行数字之间的连续转换时,速度会相应减慢。

整数算术

这是Bash循环的改进版本:

typeset -i i END
let END=5 i=1
while ((i<=END)); do
    echo $i
    …
    let i++
done

如果我们唯一想要的是echo,那么我们可以写echo$((i++))。

ephemient教会了我一些东西:Bash允许((expr;expr;expr))构造。由于我从未阅读过Bash的整个手册页(就像我很久以前在Kornshell(ksh)手册页上所做的那样),所以我错过了这一点。

So,

typeset -i i END # Let's be explicit
for ((i=1;i<=END;++i)); do echo $i; done

似乎是最节省内存的方式(不需要分配内存来消耗seq的输出,如果END非常大,这可能是一个问题),尽管可能不是“最快”的方式。

最初的问题

eschercycle注意到{a..b}Bash表示法仅适用于文字;根据Bash手册,这是正确的。可以用一个单独的(内部)fork()而不使用exec()来克服这个障碍(就像调用seq一样,这是另一个映像,需要fork+exec):

for i in $(eval echo "{1..$END}"); do

eval和echo都是Bash内置的,但是命令替换($(…)构造)需要一个fork()。


seq方法是最简单的,但Bash具有内置的算术求值。

END=5
for ((i=1;i<=END;i++)); do
    echo $i
done
# ==> outputs 1 2 3 4 5 on separate lines

for((expr1;expr2;expr3));构造的工作原理与C语言和类似语言中的for(expr1;expr2;expr3)相同,并且与其他((expr))情况一样,Bash将它们视为算术。


另一层间接:

for i in $(eval echo {1..$END}); do
    ∶

如果您使用BSD/OSX,您可以使用jot而不是seq:

for i in $(jot $END); do echo $i; done

这就是为什么最初的表达不起作用。

来自man bash:

在之前进行支撑扩展任何其他扩展,以及其他特殊字符扩展保留在后果它是严格的文本。猛击不应用任何语法对上下文的解释支撑。

因此,大括号扩展是在参数扩展之前作为纯文本宏操作完成的。

外壳是宏处理器和更正式的编程语言之间高度优化的混合体。为了优化典型用例,语言变得更加复杂,并且接受了一些限制。

正式建议

我建议坚持使用Posix1功能。这意味着在<list>中使用for i;如果列表已经知道,则使用while或seq,如:

#!/bin/sh

limit=4

i=1; while [ $i -le $limit ]; do
  echo $i
  i=$(($i + 1))
done
# Or -----------------------
for i in $(seq 1 $limit); do
  echo $i
done

1.Bash是一个很棒的shell,我以交互方式使用它,但我不会在脚本中使用Bash。脚本可能需要更快的外壳、更安全的外壳和更嵌入式的外壳。他们可能需要在任何安装为/bin/sh的设备上运行,然后就有了所有常见的支持标准的论点。还记得shellshock,又名bashtoor吗?


这些都很好,但seq被认为是不可取的,而且大多数只适用于数字范围。

如果将for循环括在双引号中,则当回显字符串时,开始变量和结束变量将被取消引用,并且可以将字符串直接发送回BASH执行$我需要用\来转义,所以在被发送到子shell之前不会进行评估。

RANGE_START=a
RANGE_END=z
echo -e "for i in {$RANGE_START..$RANGE_END}; do echo \\${i}; done" | bash

此输出也可以分配给变量:

VAR=`echo -e "for i in {$RANGE_START..$RANGE_END}; do echo \\${i}; done" | bash`

这应该产生的唯一“开销”应该是bash的第二个实例,因此它应该适合密集型操作。


我知道这个问题是关于bash的,但为了记录在案,ksh93更聪明,并按预期实现:

$ ksh -c 'i=5; for x in {1..$i}; do echo "$x"; done'
1
2
3
4
5
$ ksh -c 'echo $KSH_VERSION'
Version JM 93u+ 2012-02-29

$ bash -c 'i=5; for x in {1..$i}; do echo "$x"; done'
{1..5}

将{}替换为(()):

tmpstart=0;
tmpend=4;

for (( i=$tmpstart; i<=$tmpend; i++ )) ; do 
echo $i ;
done

产量:

0
1
2
3
4

POSIX方式

如果您关心可移植性,请使用POSIX标准中的示例:

i=2
end=5
while [ $i -le $end ]; do
    echo $i
    i=$(($i+1))
done

输出:

2
3
4
5

非POSIX的事物:

(())没有美元,尽管它是POSIX本身提到的常见扩展。[[.]在这里就足够了。另请参见:Bash中的单方括号和双方括号之间的区别是什么?用于((;;))seq(GNU内核){start..end},并且无法使用Bash手册中提到的变量。设i=i+1:POSIX 7 2。Shell命令语言不包含单词let,并且在bash上失败--posix 4.3.42i=$i+1的美元可能是必需的,但我不确定。POSIX 7 2.6.4算术扩展表示:如果外壳变量x包含形成有效整数常量的值,可选地包括前导加号或减号,则算术展开式“$((x))”和“$($x)”应返回相同的值。但从字面上看,这并不意味着$((x+1))会膨胀,因为x+1不是一个变量。


这是另一种方式:

end=5
for i in $(bash -c "echo {1..${end}}"); do echo $i; done

如果你正在执行shell命令,并且你(像我一样)对流水线有着一种迷恋,那么这个命令很好:

seq 1$END | xargs-I{}echo}


如果你需要前缀,你可能会喜欢这个

 for ((i=7;i<=12;i++)); do echo `printf "%2.0d\n" $i |sed "s/ /0/"`;done

这将产生

07
08
09
10
11
12

如果希望尽可能接近大括号表达式语法,请尝试使用bash-tricks的range.bash中的range函数。

例如,以下所有操作将执行与echo{1..10}完全相同的操作:

source range.bash
one=1
ten=10

range {$one..$ten}
range $one $ten
range {1..$ten}
range {1..10}

它试图用尽可能少的“gotchas”来支持本机bash语法:不仅支持变量,而且还防止了作为字符串提供的无效范围(例如,对于{1..a}中的i;do echo$i;done)的通常不希望的行为。

其他答案在大多数情况下都有效,但它们都至少有以下缺点之一:

其中许多都使用子外壳,这可能会损害性能,在某些系统上可能不可能。他们中的许多人依赖外部程序。甚至seq也是一个二进制文件,必须安装才能使用,必须由bash加载,并且必须包含您期望的程序,才能在这种情况下工作。无论是否无处不在,这比Bash语言本身更值得依赖。只使用本机Bash功能的解决方案,如@ephemient,将无法在字母范围内工作,如{a..z};支架膨胀将。不过,问题是关于数字的范围,所以这是一个狡辩。它们中的大多数在视觉上与{1..10}大括号扩展范围语法并不相似,因此使用这两种语法的程序可能有点难以阅读。@bobobogo的答案使用了一些熟悉的语法,但如果$END变量不是范围另一侧的有效范围“bookend”,则会出现一些意外情况。例如,如果END=a,则不会发生错误,并且将回显逐字值{1..a}。这也是Bash的默认行为——这通常是意外的。

免责声明:我是链接代码的作者。


这适用于Bash和Korn,也可以从高到低。可能不是最快或最漂亮的,但效果足够好。也处理负片。

function num_range {
   # Return a range of whole numbers from beginning value to ending value.
   # >>> num_range start end
   # start: Whole number to start with.
   # end: Whole number to end with.
   typeset s e v
   s=${1}
   e=${2}
   if (( ${e} >= ${s} )); then
      v=${s}
      while (( ${v} <= ${e} )); do
         echo ${v}
         ((v=v+1))
      done
   elif (( ${e} < ${s} )); then
      v=${s}
      while (( ${v} >= ${e} )); do
         echo ${v}
         ((v=v-1))
      done
   fi
}

function test_num_range {
   num_range 1 3 | egrep "1|2|3" | assert_lc 3
   num_range 1 3 | head -1 | assert_eq 1
   num_range -1 1 | head -1 | assert_eq "-1"
   num_range 3 1 | egrep "1|2|3" | assert_lc 3
   num_range 3 1 | head -1 | assert_eq 3
   num_range 1 -1 | tail -1 | assert_eq "-1"
}

我结合了这里的一些想法并衡量了性能。

TL;DR要点:

seq和{..}真的很快for和while循环很慢$()速度慢for((;;))循环较慢$(())甚至更慢担心内存中的N个数字(seq或{..})是愚蠢的(至少高达100万)

这些都不是结论。您必须查看这些代码背后的C代码才能得出结论。这更多的是关于我们如何使用这些机制来循环代码。大多数单次操作的速度都接近于相同的速度,在大多数情况下这并不重要。但是,像for((i=1;i<=1000000;i++))这样的机制有很多操作,正如您可以看到的那样。每个循环的操作数也比从i中得到的要多得多,单位为$(seq110000)。这对你来说可能并不明显,这就是为什么做这样的测试是有价值的。

演示

# show that seq is fast
$ time (seq 1 1000000 | wc)
 1000000 1000000 6888894

real    0m0.227s
user    0m0.239s
sys     0m0.008s

# show that {..} is fast
$ time (echo {1..1000000} | wc)
       1 1000000 6888896

real    0m1.778s
user    0m1.735s
sys     0m0.072s

# Show that for loops (even with a : noop) are slow
$ time (for i in {1..1000000} ; do :; done | wc)
       0       0       0

real    0m3.642s
user    0m3.582s
sys 0m0.057s

# show that echo is slow
$ time (for i in {1..1000000} ; do echo $i; done | wc)
 1000000 1000000 6888896

real    0m7.480s
user    0m6.803s
sys     0m2.580s

$ time (for i in $(seq 1 1000000) ; do echo $i; done | wc)
 1000000 1000000 6888894

real    0m7.029s
user    0m6.335s
sys     0m2.666s

# show that C-style for loops are slower
$ time (for (( i=1; i<=1000000; i++ )) ; do echo $i; done | wc)
 1000000 1000000 6888896

real    0m12.391s
user    0m11.069s
sys     0m3.437s

# show that arithmetic expansion is even slower
$ time (i=1; e=1000000; while [ $i -le $e ]; do echo $i; i=$(($i+1)); done | wc)
 1000000 1000000 6888896

real    0m19.696s
user    0m18.017s
sys     0m3.806s

$ time (i=1; e=1000000; while [ $i -le $e ]; do echo $i; ((i=i+1)); done | wc)
 1000000 1000000 6888896

real    0m18.629s
user    0m16.843s
sys     0m3.936s

$ time (i=1; e=1000000; while [ $i -le $e ]; do echo $((i++)); done | wc)
 1000000 1000000 6888896

real    0m17.012s
user    0m15.319s
sys     0m3.906s

# even a noop is slow
$ time (i=1; e=1000000; while [ $((i++)) -le $e ]; do :; done | wc)
       0       0       0

real    0m12.679s
user    0m11.658s
sys 0m1.004s

有很多方法可以做到这一点,但我更喜欢的方法如下

使用seq

man-seq简介

$ seq [-w] [-f format] [-s string] [-t string] [first [incr]] last

语法

完整命令seq第一次递增最后一次

first是序列中的起始编号[可选,默认为:1]incr是增量[是可选的,默认为:1]last是序列中的最后一个数字

例子:

$ seq 1 2 10
1 3 5 7 9

仅使用第一个和最后一个:

$ seq 1 5
1 2 3 4 5

仅最后一个:

$ seq 5
1 2 3 4 5

使用{first..last..incr}

这里第一个和最后一个是强制性的,incr是可选的

只使用第一个和最后一个

$ echo {1..5}
1 2 3 4 5

使用incr

$ echo {1..10..2}
1 3 5 7 9

您甚至可以对以下字符使用此选项

$ echo {a..z}
a b c d e f g h i j k l m n o p q r s t u v w x y z

如果您不想使用“seq”或“eval”或jot或算术扩展格式,例如for((i=1;i<=END;i++)),或其他循环,例如while,并且您不想只使用“printf”和“echo”,那么这个简单的解决方法可能适合您的预算:

a=1;b=5;d=‘对于{‘$a‘..‘$b‘}中的i;do echo-n“$i”;完成;'echo“$d”|bash

PS:反正我的bash没有“seq”命令。

在Mac OSX 10.6.8、Bash 3.2.48上测试