知道两个二进制文件是否相同(除了时间戳)最简单的方法是什么(在Ubuntu Linux上使用图形工具或命令行)?我不需要提取差值。我只需要知道它们是否相同。


当前回答

我最终使用hexdump将二进制文件转换为十六进制表示,然后在meld / kompare /任何其他diff工具中打开它们。我不像你,我要找的是文件中的差异。

hexdump tmp/Circle_24.png > tmp/hex1.txt
hexdump /tmp/Circle_24.png > tmp/hex2.txt

meld tmp/hex1.txt tmp/hex2.txt

其他回答

wxHexEditor

wxHexEditor是免费的,能够Diff大文件高达2^64字节(2 ExaByte)。有一个GUI。跨平台的。很多特性。

要免费获得它,请选择以下选项之一:

选项:Ubuntu包 选择:SourceForge 选择:GitHub


以下是与上面相同的建议。如果你对细节感兴趣的话。

截图

强度

•十六进制(Hex)编辑器。这对逆向工程很有帮助。

•跨平台。Linux, Mac OS, Windows

•易于使用的图形用户界面(GUI)

•支持非常大的文件高达2^64字节(2 ExaByte)

•并排比较两个大文件(diff)。可选的列表和搜索所有差异。

•搜索速度非常快

•使用少量的RAM

•不要创建临时文件。所以它只占用了很小的存储空间。

•黑暗或明亮的主题

15种语言

•开源。如果你不熟悉“开源”,这意味着这个软件有更强的安全性和更强的隐私性。因为它的代码是公开的,可以在https://github.com/EUA/wxHexEditor或https://sourceforge.net/p/wxhexeditor/code/的SourceForge上对GitHub进行审查和贡献

•吸引人的GNU通用公共许可证版本2。这意味着该扩展的软件代码由友好的非营利社区拥有和支持。而不是以营利为目的的公司。https://github.com/EUA/wxHexEditor/blob/master/LICENSE

挑战

•两个代码库之间的混淆。在撰写本文时,即2021年8月,GitHub存储库似乎是最近才出现的。最近一次更新是在2021年,网址是https://github.com/EUA/wxHexEditor 相比之下,https://sourceforge.net/projects/wxhexeditor/上的SourceForge存储库是wxHexEditor的最后一次更新是2017年12月31日。

表示支持

•如果你喜欢这个应用程序,用以下方式表达你对作者和贡献者的支持:

___•捐款:https://www.paypal.com/cgi-bin/webscr?item_name=Donation+to+wxHexEditor&cmd=_donations&business=erdem.ua%40gmail.com

___•支持与票在https://sourceforge.net/projects/wxhexeditor/support

支持论坛https://sourceforge.net/p/wxhexeditor/discussion/

___•补丁在https://sourceforge.net/p/wxhexeditor/patches/

使用

•wxHexEditor 0.23

•Debian 10 Buster

•GNOME 3.30.2

带有以下选项的Diff将进行二进制比较,以检查文件是否完全不同,如果文件相同,则输出:

diff -qs {file1} {file2}

如果你在比较两个不同目录下同名的文件,你可以使用这种形式:

diff -qs {file1} --to-file={dir2}

OS X船长

你可以使用MD5哈希函数来检查两个文件是否相同,这样你就不能看到低层次的差异,但这是一个快速比较两个文件的方法。

md5 <filename1>
md5 <filename2>

如果两个MD5哈希值(命令回显)相同,则两个文件没有区别。

为了寻找闪存缺陷,我不得不写这个脚本,它显示所有包含差异的1K块(不仅仅是cmp -b所做的第一个)

#!/bin/sh

f1=testinput.dat
f2=testoutput.dat

size=$(stat -c%s $f1)
i=0
while [ $i -lt $size ]; do
  if ! r="`cmp -n 1024 -i $i -b $f1 $f2`"; then
    printf "%8x: %s\n" $i "$r"
  fi
  i=$(expr $i + 1024)
done

输出:

   2d400: testinput.dat testoutput.dat differ: byte 3, line 1 is 200 M-^@ 240 M- 
   2dc00: testinput.dat testoutput.dat differ: byte 8, line 1 is 327 M-W 127 W
   4d000: testinput.dat testoutput.dat differ: byte 37, line 1 is 270 M-8 260 M-0
   4d400: testinput.dat testoutput.dat differ: byte 19, line 1 is  46 &  44 $

免责声明:我在5分钟内破解了脚本。它不支持命令行参数,也不支持文件名中的空格

试试不同的

简单的回答:使用-s开关运行diff。

长话短说:继续往下读。


举个例子。让我们先创建两个包含随机二进制内容的文件:

$ dd if=/dev/random bs=1k count=1 of=test1.bin
1+0 records in
1+0 records out
1024 bytes (1,0 kB, 1,0 KiB) copied, 0,0100332 s, 102 kB/s

                                                                                  
$ dd if=/dev/random bs=1k count=1 of=test2.bin
1+0 records in
1+0 records out
1024 bytes (1,0 kB, 1,0 KiB) copied, 0,0102889 s, 99,5 kB/s

现在让我们复制第一个文件:

$ cp test1.bin copyoftest1.bin

现在test1.bin和test2.bin应该是不同的:

$ diff test1.bin test2.bin
Binary files test1.bin and test2.bin differ

... test1.bin和copyoftest1.bin应该是相同的:

$ diff test1.bin copyoftest1.bin

但是等等!为什么没有输出?!?

答案是:这是有意为之。在相同的文件上没有输出。

但是有不同的错误代码:

$ diff test1.bin test2.bin
Binary files test1.bin and test2.bin differ

$ echo $?
1


$ diff test1.bin copyoftest1.bin

$ echo $?
0

幸运的是,现在你不必每次都检查错误代码,因为你可以使用-s(或——report- identity -files)开关来让diff变得更详细:

$ diff -s test1.bin copyoftest1.bin
Files test1.bin and copyoftest1.bin are identical