最快的方法来判断两个文件是否有相同的内容在Unix/Linux?

我有一个shell脚本，我需要检查两个文件是否包含相同的数据。我对很多文件都这样做，在我的脚本中，diff命令似乎是性能瓶颈。

歌词是这样的:

diff -q $dst $new > /dev/null

if ($status) then ...

是否有一种更快的方法来比较文件，也许是一个自定义算法而不是默认的diff?

当前回答

你可以通过校验和算法进行比较，比如sha256

sha256sum oldFile > oldFile.sha256

echo "$(cat oldFile.sha256) newFile" | sha256sum --check

newFile: OK

如果文件是不同的，结果将是

newFile: FAILED
sha256sum: WARNING: 1 computed checksum did NOT match

2020-08-29 11:02:48

其他回答

还可以尝试使用cksum命令:

chk1=`cksum <file1> | awk -F" " '{print $1}'`
chk2=`cksum <file2> | awk -F" " '{print $1}'`

if [ $chk1 -eq $chk2 ]
then
  echo "File is identical"
else
  echo "File is not identical"
fi

cksum命令将输出文件的字节计数。参见“man cksum”。

2016-09-23 00:59:59

因为我很糟糕，没有足够的声誉点，我不能把这个花絮作为评论。

但是，如果您打算使用cmp命令(并且不需要/不想太冗长)，您可以只获取退出状态。根据cmp手册页:

如果FILE为'-'或缺失，则读取标准输入。退出状态为0 如果输入相同，1如果不同，2如果麻烦。

所以，你可以这样做:

STATUS="$(cmp --silent $FILE1 $FILE2; echo $?)"  # "$?" gives exit status for each comparison

if [[ $STATUS -ne 0 ]]; then  # if status isn't equal to 0, then execute code
    DO A COMMAND ON $FILE1
else
    DO SOMETHING ELSE
fi

编辑:感谢大家的评论!我在这里更新了测试语法。但是，如果您正在寻找与这个答案在可读性、风格和语法方面类似的东西，我建议您使用Vasili的答案。

2018-11-28 23:27:21

如果您正在寻找更多可自定义的diff，那么可以使用git diff。

if (git diff --no-index --quiet -- old.txt new.txt) then
  echo "files contents are identical"
else
  echo "files differ"
fi

——安静禁用程序的所有输出。意味着—退出代码。

—退出代码使用类似diff(1)的代码退出程序。也就是说，如果有差异，它以1退出，0表示没有差异。

此外，还有各种算法和设置可供选择:

——diff-algorithm ={耐心| |最小直方图|迈尔斯} 选择一个差分算法。其变体如下: 基本的贪婪差分算法。目前，这是违约。花额外的时间来确保尽可能小的差异生产。在生成补丁时使用“patience diff”算法。该算法将耐心算法扩展到“支持” 低发生率的公共元素”。

2022-08-09 07:38:52

快速、安全地比较任意两个文件:

if cmp --silent -- "$FILE1" "$FILE2"; then
  echo "files contents are identical"
else
  echo "files differ"
fi

它是可读的，高效的，并且适用于任何文件名，包括“' $()”

2020-09-20 06:45:11

我喜欢@Alex Howansky用“cmp -silent”来表示这个。但我需要积极和消极的回应，所以我使用:

cmp --silent file1 file2 && echo '### SUCCESS: Files Are Identical! ###' || echo '### WARNING: Files Are Different! ###'

然后，我可以在终端中运行它，或者使用ssh根据常量文件检查文件。

2015-10-01 01:01:55

最快的方法来判断两个文件是否有相同的内容在Unix/Linux?

推荐文章

最新文章

标签