我正在寻找一种简单的方法来找到文件中最长行的长度。理想情况下,它应该是一个简单的bash shell命令,而不是脚本。
当前回答
我在Unix环境中,使用gzip压缩的文件,大小只有几gb。我使用一个记录长度为2052的2 GB gzip文件测试了以下命令。
zcat < gzipped文件- > |厕所
and
Zcat <gzip文件> | awk '{打印长度}' | sort -u
时间是平均的
117秒 109秒
这是我运行10次后的脚本。
START=$(date +%s) ## time of start
zcat $1 | wc -L
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
START=$(date +%s) ## time of start
zcat $1 | awk '{print length}' | sort -u
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
其他回答
perl -ne 'print length()." line $. $_"' myfile | sort -nr | head -n 1
打印最长行的长度、行号和内容
perl -ne 'print length()." line $. $_"' myfile | sort -n
打印所有行的排序列表,包括行号和长度
. 是连接运算符-它在这里用在length()之后 美元。当前行号是多少 $_是当前行
我在Unix环境中,使用gzip压缩的文件,大小只有几gb。我使用一个记录长度为2052的2 GB gzip文件测试了以下命令。
zcat < gzipped文件- > |厕所
and
Zcat <gzip文件> | awk '{打印长度}' | sort -u
时间是平均的
117秒 109秒
这是我运行10次后的脚本。
START=$(date +%s) ## time of start
zcat $1 | wc -L
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
START=$(date +%s) ## time of start
zcat $1 | awk '{print length}' | sort -u
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
使用wc (GNU coreutils) 7.4:
wc -L filename
给:
101 filename
纯粹的POSIX shell解决方案,没有无用的cat使用,也没有外部命令的分叉。以filename作为第一个参数:
#!/bin/sh
MAX=0 IFS=
while read -r line; do
if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
wc -L < filename
给了
101