在shell脚本中从文件中读取随机行有什么简单的方法?


当前回答

使用bash脚本:

#!/bin/bash
# replace with file to read
FILE=tmp.txt
# count number of lines
NUM=$(wc - l < ${FILE})
# generate random number in range 0-NUM
let X=${RANDOM} % ${NUM} + 1
# extract X-th line
sed -n ${X}p ${FILE}

其他回答

下面是一个简单的Python脚本,可以完成这项工作:

import random, sys
lines = open(sys.argv[1]).readlines()
print(lines[random.randrange(len(lines))])

用法:

python randline.py file_to_get_random_line_from

另一个选择:

head -$((${RANDOM} % `wc -l < file` + 1)) file | tail -1

这很简单。

cat file.txt | shuf -n 1

当然,这只是比“shuf -n 1 file.txt”本身稍微慢一点。

sort --random-sort $FILE | head -n 1

(我更喜欢上面的shiff方法——我甚至不知道它的存在,我自己也永远不会找到这个工具)

一个解决方案,也适用于MacOSX,应该也适用于Linux(?):

N=5
awk 'NR==FNR {lineN[$1]; next}(FNR in lineN)' <(jot -r $N 1 $(wc -l < $file)) $file 

地点:

N是你想要的随机行数 NR = = FNR{亚麻(1美元);next}(亚麻中的FNR) file1 file2 ——>保存file1中写入的行号,然后打印file2中相应的行 jot -r $N 1 $(wc -l < $file)——>在(1,number_of_line_in_file)范围内随机抽取N个数字(-r)。进程替换<()将使它看起来像解释器的文件,即前面示例中的file1。