从文件中读取随机行有什么简单的方法?

在shell脚本中从文件中读取随机行有什么简单的方法?

当前回答

perlfaq5:我如何从文件中选择一个随机的行?下面是Camel Book上的一个油藏采样算法:

perl -e 'srand; rand($.) < 1 && ($line = $_) while <>; print $line;' file

与读取整个文件相比，这在空间上有很大的优势。你可以在Donald E. Knuth的《计算机编程艺术》第2卷第3.4.2节中找到这种方法的证明。

2009-01-15 19:06:24

其他回答

以下是我的发现，因为我的Mac OS不使用所有简单的答案。我使用jot命令来生成一个数字，因为$RANDOM变量解决方案在我的测试中似乎不是很随机。当测试我的解决方案时，我在输出中提供的解决方案中有很大的差异。

  RANDOM1=`jot -r 1 1 235886`
   #range of jot ( 1 235886 ) found from earlier wc -w /usr/share/dict/web2
   echo $RANDOM1
   head -n $RANDOM1 /usr/share/dict/web2 | tail -n 1

变量的回声是为了得到生成的随机数的视觉效果。

2017-08-23 07:41:10

perlfaq5:我如何从文件中选择一个随机的行?下面是Camel Book上的一个油藏采样算法:

perl -e 'srand; rand($.) < 1 && ($line = $_) while <>; print $line;' file

与读取整个文件相比，这在空间上有很大的优势。你可以在Donald E. Knuth的《计算机编程艺术》第2卷第3.4.2节中找到这种方法的证明。

2009-01-15 19:06:24

这很简单。

cat file.txt | shuf -n 1

当然，这只是比“shuf -n 1 file.txt”本身稍微慢一点。

2016-05-23 07:01:26

单个bash行:

sed -n $((1+$RANDOM%`wc -l test.txt | cut -f 1 -d ' '`))p test.txt

小问题:重复的文件名。

2009-01-15 19:17:59

一个解决方案，也适用于MacOSX，应该也适用于Linux(?):

N=5
awk 'NR==FNR {lineN[$1]; next}(FNR in lineN)' <(jot -r $N 1 $(wc -l < $file)) $file

地点:

N是你想要的随机行数 NR = = FNR{亚麻(1美元);next}(亚麻中的FNR) file1 file2 ——>保存file1中写入的行号，然后打印file2中相应的行 jot -r $N 1 $(wc -l < $file)——>在(1,number_of_line_in_file)范围内随机抽取N个数字(-r)。进程替换<()将使它看起来像解释器的文件，即前面示例中的file1。

2015-08-17 09:10:07

从文件中读取随机行有什么简单的方法?

推荐文章

最新文章

标签