从文件中读取随机行有什么简单的方法?

在shell脚本中从文件中读取随机行有什么简单的方法?

当前回答

你可以使用shuf:

shuf -n 1 $FILE

还有一个实用程序叫做rl。在Debian中，它是在随机行包中，尽管不是在所有发行版中都可用，但它确实是你想要的。在它的主页上，它实际上推荐使用shuf(我相信它创建时还不存在)。shuf是GNU coreutils的一部分，rl不是。

rl -c 1 $FILE

2009-01-15 19:30:38

其他回答

另一种使用awk的方法

awk NR==$((${RANDOM} % `wc -l < file.name` + 1)) file.name

2013-09-04 06:43:08

sort --random-sort $FILE | head -n 1

(我更喜欢上面的shiff方法——我甚至不知道它的存在，我自己也永远不会找到这个工具)

2010-11-10 12:28:04

一个解决方案，也适用于MacOSX，应该也适用于Linux(?):

N=5
awk 'NR==FNR {lineN[$1]; next}(FNR in lineN)' <(jot -r $N 1 $(wc -l < $file)) $file

地点:

N是你想要的随机行数 NR = = FNR{亚麻(1美元);next}(亚麻中的FNR) file1 file2 ——>保存file1中写入的行号，然后打印file2中相应的行 jot -r $N 1 $(wc -l < $file)——>在(1,number_of_line_in_file)范围内随机抽取N个数字(-r)。进程替换<()将使它看起来像解释器的文件，即前面示例中的file1。

2015-08-17 09:10:07

这很简单。

cat file.txt | shuf -n 1

当然，这只是比“shuf -n 1 file.txt”本身稍微慢一点。

2016-05-23 07:01:26

只使用普通sed和awk，不使用$RANDOM，一个简单、节省空间和合理快速的“一行程序”可以从文件名FILENAME中伪随机地选择一行，如下所示:

sed -n $(awk 'END {srand(); r=rand()*NR; if (r<NR) {sub(/\..*/,"",r); r++;}; print r}' FILENAME)p FILENAME

(即使FILENAME为空也能工作，在这种情况下不会触发任何行。)

这种方法的一个可能的优点是它只调用rand()一次。

正如@AdamKatz在评论中指出的，另一种可能是为每一行调用rand():

awk 'rand() * NR < 1 { line = $0 } END { print line }' FILENAME

(基于归纳法可以给出简单的正确性证明。)

关于rand的警告()

在大多数awk实现中，包括gawk, rand()每次运行awk时都从相同的起始数字或种子开始生成数字。

——https://www.gnu.org/software/gawk/manual/html_node/Numeric-Functions.html

2015-12-14 21:43:06

从文件中读取随机行有什么简单的方法?

推荐文章

最新文章

标签