我试图让bash处理来自stdin的数据,但没有运气。我的意思是以下工作都不做:
echo "hello world" | test=($(< /dev/stdin)); echo test=$test
test=
echo "hello world" | read test; echo test=$test
test=
echo "hello world" | test=`cat`; echo test=$test
test=
我希望输出为test=hello world。我尝试在“$test”周围加上“”引号,但也不起作用。
问题是如何捕获命令的输出,以保存在变量中,以便稍后在脚本中使用。我可能会重复一些之前的答案,但我试着把我能想到的所有答案排列起来进行比较和评论,所以请容忍我。
直观的构造
echo test | read x
echo x=$x
在Korn shell中是有效的,因为ksh已经实现了管道系列中的最后一个命令是当前shell的一部分。前面的管道命令是子shell。相反,其他shell将所有管道命令定义为子shell,包括最后一个。
这正是我更喜欢ksh的原因。
但必须复制与其他shell, bash f.ex。,则必须使用另一种结构。
要捕获1个值,这个构造是可行的:
x=$(echo test)
echo x=$x
但这只能满足收集1个值以供以后使用的需求。
为了捕获更多的值,这个构造是有用的,在bash和ksh中工作:
read x y <<< $(echo test again)
echo x=$x y=$y
有一个变种,我注意到在bash工作,但不是在ksh:
read x y < <(echo test again)
echo x=$x y=$y
<<< $(…)是一个here-document变体,它提供了标准命令行的所有元处理。< <(…)是文件替换操作符的输入重定向。
我现在在所有脚本中都使用“<<< $(”,因为它似乎是shell变量之间最可移植的构造。我有一套工具,可以在任何Unix风格的作业中随身携带。
当然,有一个普遍可行但粗糙的解决方案:
command-1 | {command-2; echo "x=test; y=again" > file.tmp; chmod 700 file.tmp}
. ./file.tmp
rm file.tmp
echo x=$x y=$y
因为我上当了,我想留个便条。
我发现了这个线程,因为我必须重写一个旧的sh脚本
POSIX兼容。
这基本上意味着绕过POSIX引入的管道/子shell问题,重写如下代码:
some_command | read a b c
成:
read a b c << EOF
$(some_command)
EOF
代码是这样的:
some_command |
while read a b c; do
# something
done
成:
while read a b c; do
# something
done << EOF
$(some_command)
EOF
但后者在空输入时表现不一样。
使用旧的符号,while循环不会在空输入时输入,
但在POSIX符号中它是!
我认为这是由于EOF之前的换行,
这一点不容忽视。
POSIX代码的行为更像旧的符号
看起来是这样的:
while read a b c; do
case $a in ("") break; esac
# something
done << EOF
$(some_command)
EOF
在大多数情况下,这就足够了。
但不幸的是,这仍然不完全像以前的符号
如果some_command打印空行。
在旧的表示法中,执行while主体
在POSIX符号中,我们在主体前面中断。
解决这个问题的方法是这样的:
while read a b c; do
case $a in ("something_guaranteed_not_to_be_printed_by_some_command") break; esac
# something
done << EOF
$(some_command)
echo "something_guaranteed_not_to_be_printed_by_some_command"
EOF
如果你想读入大量数据并分别处理每一行,你可以使用这样的方法:
cat myFile | while read x ; do echo $x ; done
如果你想把这些行分成多个单词,你可以使用多个变量来代替x,就像这样:
cat myFile | while read x y ; do echo $y $x ; done
另外:
while read x y ; do echo $y $x ; done < myFile
但是一旦你开始想要做一些真正聪明的事情,你最好选择一些脚本语言,比如perl,你可以尝试这样的事情:
perl -ane 'print "$F[0]\n"' < myFile
使用perl(或者我猜这些语言中的任何一种)有一个相当陡峭的学习曲线,但如果您想做任何事情,而不是最简单的脚本,从长远来看,您会发现它要容易得多。我推荐《Perl烹饪书》,当然还有Larry Wall等人写的《Perl编程语言》。
我想要类似的东西——一个可以解析字符串的函数,可以作为参数或管道传递。
我提出了一个解决方案如下(工作作为#!/bin/sh和作为#!/bin/bash)
#!/bin/sh
set -eu
my_func() {
local content=""
# if the first param is an empty string or is not set
if [ -z ${1+x} ]; then
# read content from a pipe if passed or from a user input if not passed
while read line; do content="${content}$line"; done < /dev/stdin
# first param was set (it may be an empty string)
else
content="$1"
fi
echo "Content: '$content'";
}
printf "0. $(my_func "")\n"
printf "1. $(my_func "one")\n"
printf "2. $(echo "two" | my_func)\n"
printf "3. $(my_func)\n"
printf "End\n"
输出:
0. Content: ''
1. Content: 'one'
2. Content: 'two'
typed text
3. Content: 'typed text'
End
对于最后一种情况(3.),您需要键入,按enter和CTRL+D结束输入。
一个智能脚本,可以从PIPE和命令行参数读取数据:
#!/bin/bash
if [[ -p /dev/stdin ]]
then
PIPE=$(cat -)
echo "PIPE=$PIPE"
fi
echo "ARGS=$@"
输出:
$ bash test arg1 arg2
ARGS=arg1 arg2
$ echo pipe_data1 | bash test arg1 arg2
PIPE=pipe_data1
ARGS=arg1 arg2
解释:当脚本通过管道接收任何数据时,/dev/stdin(或/proc/self/fd/0)将是到管道的符号链接。
/proc/self/fd/0 -> pipe:[155938]
如果不是,它将指向当前终端:
/proc/self/fd/0 -> /dev/pts/5
bash [[-p选项可以检查它是否是管道。
Cat -读取from stdin。
如果我们在没有stdin的情况下使用cat -,它将永远等待,这就是为什么我们把它放在If条件中。