我正在寻找一种简单的方法来找到文件中最长行的长度。理想情况下,它应该是一个简单的bash shell命令,而不是脚本。
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE
以下是回答者的参考资料
cat filename | awk '{print length, $0}'|sort -nr|head -1
http://wtanaka.com/node/7719
在perl中:
perl -ne 'print ($l = $_) if (length > length($l));' filename | tail -1
这只打印行,不打印它的长度。
主题的变化。
它将显示文件中最长行长度的所有行,并保留它们在源代码中出现的顺序。
FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE
那么myfile
x
mn
xyz
123
abc
将会给
xyz
123
abc
只是为了好玩,下面是Powershell版本:
cat filename.txt | sort length | select -last 1
为了得到长度:
(cat filename.txt | sort length | select -last 1).Length
纯粹的POSIX shell解决方案,没有无用的cat使用,也没有外部命令的分叉。以filename作为第一个参数:
#!/bin/sh
MAX=0 IFS=
while read -r line; do
if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
以上例子中被忽略的重要一点。
下面两个示例计算展开的选项卡
wc -L <"${SourceFile}"
# or
expand --tabs=8 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'
以下2个计数为未展开的选项卡。
expand --tabs=1 "${SourceFile}" | wc -L
# or
awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"
so
Expanded nonexpanded
$'nn\tnn' 10 5
看起来所有的答案都没有给出最长的行号。以下命令可以给出行号和大致长度:
$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11
perl -ne 'print length()." line $. $_"' myfile | sort -nr | head -n 1
打印最长行的长度、行号和内容
perl -ne 'print length()." line $. $_"' myfile | sort -n
打印所有行的排序列表,包括行号和长度
. 是连接运算符-它在这里用在length()之后 美元。当前行号是多少 $_是当前行
我在Unix环境中,使用gzip压缩的文件,大小只有几gb。我使用一个记录长度为2052的2 GB gzip文件测试了以下命令。
zcat < gzipped文件- > |厕所
and
Zcat <gzip文件> | awk '{打印长度}' | sort -u
时间是平均的
117秒 109秒
这是我运行10次后的脚本。
START=$(date +%s) ## time of start
zcat $1 | wc -L
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
START=$(date +%s) ## time of start
zcat $1 | awk '{print length}' | sort -u
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
如果您正在使用MacOS并得到以下错误: wc:非法选项——L你不需要安装GNU sipmly这样做。
如果你所要做的只是获取文件中最长行的字符数,并且使用OS X运行:
Awk '{打印长度}' "$file_name" | sort -rn | head -1
像这样的东西;
$file_name" $(awk '{打印长度}' "$file_name" | sort -rn | head -1)字符"
输出:
文件my_file中最长的一行有117个字符
推荐文章
- 文件中最长的一行
- 从URL执行bash脚本
- [: shell编程中的意外操作符
- 如何在变量中存储标准错误
- 如何为文件的每一行运行命令(例如chmod) ?
- 如何使用Bash创建一个文件夹,如果它还不存在?
- Github权限被拒绝:ssh添加代理没有身份
- 在bash中使用正则表达式进行搜索和替换
- 如何在Python中实现常见的bash习语?
- 如何通过docker运行传递参数到Shell脚本
- Bash“if [false];”返回true而不是false——为什么?
- 在shell脚本中使用$()而不是反引号的好处是什么?
- 快速unix命令显示文件中间的特定行?
- 如何从查找“类型d”中排除此/ current / dot文件夹
- 检查bash变量是否等于0