我正在寻找一种简单的方法来找到文件中最长行的长度。理想情况下,它应该是一个简单的bash shell命令,而不是脚本。
当前回答
我在Unix环境中,使用gzip压缩的文件,大小只有几gb。我使用一个记录长度为2052的2 GB gzip文件测试了以下命令。
zcat < gzipped文件- > |厕所
and
Zcat <gzip文件> | awk '{打印长度}' | sort -u
时间是平均的
117秒 109秒
这是我运行10次后的脚本。
START=$(date +%s) ## time of start
zcat $1 | wc -L
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
START=$(date +%s) ## time of start
zcat $1 | awk '{print length}' | sort -u
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
其他回答
只是为了好玩,下面是Powershell版本:
cat filename.txt | sort length | select -last 1
为了得到长度:
(cat filename.txt | sort length | select -last 1).Length
wc -L < filename
给了
101
如果您正在使用MacOS并得到以下错误: wc:非法选项——L你不需要安装GNU sipmly这样做。
如果你所要做的只是获取文件中最长行的字符数,并且使用OS X运行:
Awk '{打印长度}' "$file_name" | sort -rn | head -1
像这样的东西;
$file_name" $(awk '{打印长度}' "$file_name" | sort -rn | head -1)字符"
输出:
文件my_file中最长的一行有117个字符
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE
纯粹的POSIX shell解决方案,没有无用的cat使用,也没有外部命令的分叉。以filename作为第一个参数:
#!/bin/sh
MAX=0 IFS=
while read -r line; do
if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
推荐文章
- 在OSX中永久设置PATH环境变量
- 删除Bash脚本中的重复条目
- 如何将Bash命令的输出分配给变量?
- 在bash中传递数组作为参数
- PHP中的异步shell执行器
- 如何在shell中为for循环添加前导零?
- Bash中单方括号和双方括号的区别
- Git显示“警告:永久添加到已知主机列表”
- 我如何找到传递给Bash脚本的参数的数量?
- 查找文件名以指定字符串开头的所有文件?
- 如何在Bash中逐行合并两个文件
- 检索Linux上单个进程的CPU使用情况和内存使用情况?
- 如何从远程SSH会话发送数据到本地剪贴板
- 我如何得到bash完成工作与别名?
- 通过使用shell脚本替换文件名中的特定模式来重命名多个文件