我有两个文件:file1和file2。如何将file2的内容追加到file1,使file1的内容持久化进程?
Cat file2 >> file1
>>操作符将输出追加到命名文件,如果命名文件不存在,则创建该文件。
Cat file1 file2 > file3
这将两个或多个文件连接到一个文件。您可以拥有任意数量的源文件。例如,
Cat *.txt >> newfile.txt
Update 20130902 In the comments eumiro suggests "don't try cat file1 file2 > file1." The reason this might not result in the expected outcome is that the file receiving the redirect is prepared before the command to the left of the > is executed. In this case, first file1 is truncated to zero length and opened for output, then the cat command attempts to concatenate the now zero-length file plus the contents of file2 into file1. The result is that the original contents of file1 are lost and in its place is a copy of file2 which probably isn't what was expected.
更新20160919 在评论中,tpartee建议链接到支持信息/来源。为了获得权威的参考,我引导善良的读者去linuxcommand.org的sh手册页,上面写着:
在执行命令之前,命令的输入和输出可能会被重定向 使用shell解释的特殊符号。
虽然这确实告诉读者他们需要知道什么,但如果你没有逐字逐句地寻找和分析语句,就很容易错过。这里最重要的单词是before。执行命令前重定向已完成(或失败)。
在cat file1 file2 > file1的示例中,shell首先执行重定向,以便I/O句柄在执行命令之前位于执行命令的环境中。
在Ian Allen的网站上可以以Linux课件的形式找到一个更友好的版本,其中详细介绍了重定向优先级。他的I/O重定向笔记页面中有很多关于这个主题的内容,包括重定向即使没有命令也能工作。把这个传递给shell:
$ >out
...创建一个名为out的空文件。shell首先设置I/O重定向,然后查找命令,没有找到命令,然后完成操作。
仅供参考,使用ddrescue提供了一种可中断的方式来完成任务,例如,如果你有大文件,需要暂停,然后在稍后的某个点继续执行:
ddrescue -o $(wc --bytes file1 | awk '{ print $1 }') file2 file1 logfile
日志文件是重要的位。您可以使用Ctrl-C中断该进程,并通过再次指定完全相同的命令来恢复它,ddrescue将读取日志文件并从它停止的地方恢复。-o A标志告诉ddrescue从输出文件(file1)中的字节A开始。所以wc——bytes file1 | awk '{print $1}'只是以字节为单位提取file1的大小(如果你喜欢,你可以直接从ls中粘贴输出)。
正如ngks在评论中指出的,缺点是ddrescue在默认情况下可能不会被安装,所以你必须手动安装它。另一个复杂的问题是,在你的存储库中可能有两个版本的ddrescue:查看这个askubuntu问题以获得更多信息。你想要的版本是GNU的ddrescue,在基于debian的系统上是名为gddrescue的包:
sudo apt install gddrescue
对于其他发行版,请检查您的包管理系统中GNU版本的ddrescue。
注意:如果你需要使用sudo,请这样做:
Sudo bash -c 'cat file2 >> file1'
简单地将sudo放在命令前的通常方法将失败,因为特权升级不会延续到输出重定向中。
Cat可以是简单的解决方案,但当我们连接大文件时变得非常缓慢,find -print可以拯救你,尽管你必须使用Cat一次。
amey@xps ~/work/python/tmp $ ls -lhtr
total 969M
-rw-r--r-- 1 amey amey 485M May 24 23:54 bigFile2.txt
-rw-r--r-- 1 amey amey 485M May 24 23:55 bigFile1.txt
amey@xps ~/work/python/tmp $ time cat bigFile1.txt bigFile2.txt >> out.txt
real 0m3.084s
user 0m0.012s
sys 0m2.308s
amey@xps ~/work/python/tmp $ time find . -maxdepth 1 -type f -name 'bigFile*' -print0 | xargs -0 cat -- > outFile1
real 0m2.516s
user 0m0.028s
sys 0m2.204s
另一个解决方案:
tee < file1 -a file2
Tee的好处是,你可以添加到尽可能多的文件,例如:
tee < file1 -a file2 file3 file3
将file1的内容追加到file2、file3和fil4。
从手册页:
-a, --append
append to the given FILEs, do not overwrite
Zsh特定:你也可以在没有cat的情况下做到这一点,尽管老实说cat更可读:
>> file1 < file2
>>将STDIN附加到file1, < dumps file2附加到STDIN。
推荐文章
- 如何从查找“类型d”中排除此/ current / dot文件夹
- 在tmux中保持窗口名称固定
- 只使用md5sum获取哈希值(没有文件名)
- 如何生成一个核心转储在Linux上的分段错误?
- 在Python中如何在Linux和Windows中使用“/”(目录分隔符)?
- 使用sh shell比较字符串
- 在Bash中测试非零长度字符串:[-n "$var"]或["$var"]
- 从包含文件名的路径获取不包含文件名的完整路径
- 如何创建Bash别名?
- 如何设置ssh超时时间?
- 将所有变量从一个shell脚本传递到另一个?
- 只列出UNIX中的目录
- Git:从另一个分支复制目录中的所有文件
- PHP,获取没有文件扩展名的文件名
- 如何在Apache服务器上自动将HTTP重定向到HTTPS ?