在Bash中循环浏览文件内容

如何使用Bash遍历文本文件的每一行？

使用此脚本：

echo "Start!"
for p in (peptides.txt)
do
    echo "${p}"
done

我在屏幕上看到这个输出：

Start!
./runPep.sh: line 3: syntax error near unexpected token `('
./runPep.sh: line 3: `for p in (peptides.txt)'

（后来我想用$p做一些比输出到屏幕更复杂的事情。）

环境变量SHELL是（来自env）：

SHELL=/bin/bash

/bin/bash—版本输出：

GNU bash, version 3.1.17(1)-release (x86_64-suse-linux-gnu)
Copyright (C) 2005 Free Software Foundation, Inc.

cat/proc/version输出：

Linux version 2.6.18.2-34-default (geeko@buildhost) (gcc version 4.1.2 20061115 (prerelease) (SUSE Linux)) #1 SMP Mon Nov 27 11:46:27 UTC 2006

peptides.txt文件包含：

RKEKNVQ
IPKKLLQK
QYFHQLEKMNVK
IPKKLLQK
GDLSTALEVAIDCYEK
QYFHQLEKMNVKIPENIYR
RKEKNVQ
VLAKHGKLQDAIN
ILGFMK
LEDVALQILL

当前回答

这并不比其他答案更好，但这是在没有空格的文件中完成工作的又一种方法（请参见注释）。我发现我经常需要一行程序来挖掘文本文件中的列表，而不需要使用单独的脚本文件。

for word in $(cat peptides.txt); do echo $word; done

这种格式允许我将其全部放在一个命令行中。将“echo$word”部分更改为您想要的任何内容，您可以发出多个以分号分隔的命令。下面的示例使用文件的内容作为您可能编写的其他两个脚本的参数。

for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done

或者，如果您打算像流编辑器一样使用它（学习sed），可以将输出转储到另一个文件，如下所示。

for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done > outfile.txt

我使用了上面写的这些，因为我使用的是文本文件，我在其中每行创建了一个单词。（请参见注释）如果您有空格不想拆分单词/行，那么它会变得有点难看，但相同的命令仍然可以工作如下：

OLDIFS=$IFS; IFS=$'\n'; for line in $(cat peptides.txt); do cmd_a.sh $line; cmd_b.py $line; done > outfile.txt; IFS=$OLDIFS

这只是告诉shell只在换行上拆分，而不是在空格上拆分，然后将环境返回到以前的状态。此时，您可能需要考虑将其全部放入shell脚本，而不是将其全部压缩到一行中。

祝你好运！

2013-10-04 13:30:51

其他回答

这是我的真实例子，如何循环另一个程序输出的行，检查子字符串，从变量中删除双引号，在循环之外使用该变量。我想很多人迟早会问这些问题。

##Parse FPS from first video stream, drop quotes from fps variable
## streams.stream.0.codec_type="video"
## streams.stream.0.r_frame_rate="24000/1001"
## streams.stream.0.avg_frame_rate="24000/1001"
FPS=unknown
while read -r line; do
  if [[ $FPS == "unknown" ]] && [[ $line == *".codec_type=\"video\""* ]]; then
    echo ParseFPS $line
    FPS=parse
  fi
  if [[ $FPS == "parse" ]] && [[ $line == *".r_frame_rate="* ]]; then
    echo ParseFPS $line
    FPS=${line##*=}
    FPS="${FPS%\"}"
    FPS="${FPS#\"}"
  fi
done <<< "$(ffprobe -v quiet -print_format flat -show_format -show_streams -i "$input")"
if [ "$FPS" == "unknown" ] || [ "$FPS" == "parse" ]; then 
  echo ParseFPS Unknown frame rate
fi
echo Found $FPS

在循环外声明变量，设置值并在循环外使用它需要done＜＜“$（…）”语法。应用程序需要在当前控制台的上下文中运行。命令周围的引号保留输出流的换行符。

子字符串的循环匹配然后读取name＝value对，拆分last＝字符的右侧部分，删除第一个引号，删除最后一个引号，我们有一个干净的值可以在其他地方使用。

2015-06-30 08:15:45

for word in $(cat peptides.txt); do echo $word; done

for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done

或者，如果您打算像流编辑器一样使用它（学习sed），可以将输出转储到另一个文件，如下所示。

for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done > outfile.txt

OLDIFS=$IFS; IFS=$'\n'; for line in $(cat peptides.txt); do cmd_a.sh $line; cmd_b.py $line; done > outfile.txt; IFS=$OLDIFS

祝你好运！

2013-10-04 13:30:51

使用while循环，如下所示：

while IFS= read -r line; do
   echo "$line"
done <file

笔记：

如果不正确设置IFS，将丢失缩进。您几乎应该始终在read中使用-r选项。不读取带有for的行

2015-06-09 15:09:00

cat peptides.txt | while read line 
do
   # do something with $line here
done

以及单衬里变体：

cat peptides.txt | while read line; do something_with_$line_here; done

如果没有换行符，这些选项将跳过文件的最后一行。

您可以通过以下方式避免此问题：

cat peptides.txt | while read line || [[ -n $line ]];
do
   # do something with $line here
done

2009-10-05 17:54:38

假设您有此文件：

$ cat /tmp/test.txt
Line 1
    Line 2 has leading space
Line 3 followed by blank line

Line 5 (follows a blank line) and has trailing space    
Line 6 has no ending CR

有四个元素将改变许多Bash解决方案读取的文件输出的含义：

空白行4；两行上的前导或尾随空格；保持各行的含义（即，每行都是一条记录）；线路6未以CR终止。

如果您希望文本文件一行一行地包含空白行和没有CR的终止行，则必须使用while循环，并且必须对最后一行进行替换测试。

以下是可能更改文件的方法（与cat返回的方法相比）：

1）丢失最后一行以及前导空格和尾随空格：

$ while read -r p; do printf "%s\n" "'$p'"; done </tmp/test.txt
'Line 1'
'Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space'

（如果在IFS=read-r p；do printf“%s\n”“'$p'”；done</tmp/test.txt时执行，则保留前导空格和尾随空格，但如果最后一行未以CR结尾，则仍会丢失）

2）将进程替换与cat一起使用将一口气读取整个文件，并失去单个行的含义：

$ for p in "$(cat /tmp/test.txt)"; do printf "%s\n" "'$p'"; done
'Line 1
    Line 2 has leading space
Line 3 followed by blank line

Line 5 (follows a blank line) and has trailing space    
Line 6 has no ending CR'

（如果您从$（cat/tmp/test.txt）中删除“”，您将逐字逐句地阅读文件，而不是一饮而尽。也可能不是预期的内容…）

逐行读取文件并保留所有间距的最可靠和最简单的方法是：

$ while IFS= read -r line || [[ -n $line ]]; do printf "'%s'\n" "$line"; done </tmp/test.txt
'Line 1'
'    Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space    '
'Line 6 has no ending CR'

如果您想去掉前导空格和交易空格，请删除IFS=部分：

$ while read -r line || [[ -n $line ]]; do printf "'%s'\n" "$line"; done </tmp/test.txt
'Line 1'
'Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space'
'Line 6 has no ending CR'

（一个没有终止符的文本文件，虽然在POSIX下很常见，但被认为是已损坏的。如果您可以指望结尾符，则在while循环中不需要||[[-n$line]]。）

更多关于BASH常见问题解答

2016-02-03 19:15:14

在Bash中循环浏览文件内容

推荐文章

最新文章

标签