是否有一个简单的shell命令/脚本支持排除某些文件/文件夹的归档?

我有一个需要归档的目录,其中有一个子目录,其中有许多非常大的文件,我不需要备份。

不完全是解决方案:

tar——exclude=PATTERN命令匹配给定的模式并排除那些文件,但我需要忽略特定的文件和文件夹(完整的文件路径),否则有效的文件可能会被排除。

我还可以使用find命令创建一个文件列表,排除我不想存档的文件,并将该列表传递给tar,但这只适用于少量文件。我有成千上万。

我开始认为唯一的解决方案是创建一个包含要排除的文件/文件夹列表的文件,然后使用rsync with——exclude-from=file将所有文件复制到tmp目录,然后使用tar对该目录进行归档。

谁能想到更好/更有效的解决办法?

编辑:查尔斯·马的解决方案很有效。最大的问题是——exclude='。/folder'必须在tar命令的开头。完整命令(先cd,所以备份相对于该目录):

cd /folder_to_backup
tar --exclude='./folder' --exclude='./upload/folder2' -zcvf /backup/filename.tgz .

当前回答

Gnu tar v 1.26的——exclude需要出现在存档文件和备份目录参数之后,不应该有前导或尾随的斜杠,最好没有引号(单引号或双引号)。所以相对于要备份的PARENT目录,它是:

Tar CVFZ /path_to/mytar. txtTGZ ./dir_to_backup——exclude=some_path/to_exclude

其他回答

使用find命令和tar append (-r)选项一起使用。通过这种方式,您可以在一个步骤中向现有的tar中添加文件,而不是两步解决方案(创建文件列表,创建tar)。

find /dir/dir -prune ... -o etc etc.... -exec tar rvf ~/tarfile.tar {} \;

在阅读完这篇文章后,我在RHEL 5上做了一些测试,下面是我对abc目录的测试结果:

这将排除目录错误和日志以及目录下的所有文件:

tar cvpzf abc.tgz abc/ --exclude='abc/error' --exclude='abc/logs'

在排除的目录后添加通配符将排除文件,但保留目录:

tar cvpzf abc.tgz abc/ --exclude='abc/error/*' --exclude='abc/logs/*'

在阅读了所有这些不同版本的好答案并为自己解决了问题之后,我认为有一些非常重要的小细节,对于GNU/Linux的普遍使用来说是非常罕见的,这些细节没有得到足够的强调,值得更多的评论。

所以我不打算回答每个情况的问题,相反,试着记下当东西不工作的时候去哪里看。

注意这一点非常重要:

THE ORDER OF THE OPTIONS MATTER: it is not the same put the --exclude before than after the file option and directories to backup. This is unexpected at least to me, because in my experience, in GNU/Linux commands, usually the order of the options doesn't matter. Different tar versions expects this options in different order: for instance, @Andrew's answer indicates that in GNU tar v 1.26 and 1.28 the excludes comes last, whereas in my case, with GNU tar 1.29, it's the other way. THE TRAILING SLASHES MATTER: at least in GNU tar 1.29, it shouldn't be any.

在我的例子中,对于Debian扩展上的GNU tar 1.29,有效的命令是

tar --exclude="/home/user/.config/chromium" --exclude="/home/user/.cache" -cf file.tar  /dir1/ /home/ /dir3/

引语不重要,不管有没有引语都有用。

我希望这对一些人有用。

对于Mac OSX,我必须这么做

tar -zcv——exclude='folder' -f theOutputTarFile.tar folderToTar .tar -zcv——exclude='folder

注意——exclude=后面的-f

我同意——exclude标志是正确的方法。

$ tar --exclude='./folder_or_file' --exclude='file_pattern' --exclude='fileA'

我要提醒大家的是,我并没有发现明显的副作用: 在本例中排除'fileA'将递归地搜索'fileA' !

示例:一个包含同名文件(data.txt)的单子目录的目录

data.txt
config.txt
--+dirA
  |  data.txt
  |  config.docx

如果使用——exclude='data.txt',存档将不包含data.txt文件。如果对第三方库(比如node_modules目录)进行归档,可能会导致意想不到的结果。 为了避免这个问题,请确保给出整个路径,比如——exclude='./dirA/data.txt'