在Linux系统上快速创建大文件

如何在Linux (Red Hat Linux)系统中快速创建大文件?

dd可以完成这项工作，但是从/dev/zero读取并写入驱动器可能会花费很长时间，因为您需要一个几百gb大小的文件进行测试……如果你需要重复这样做，时间就会增加。

我不关心文件的内容，我只想快速创建它。如何做到这一点呢?

使用稀疏文件不能解决这个问题。我需要为文件分配磁盘空间。

当前回答

GPL mkfile只是dd的一个(ba)sh脚本包装器;BSD的mkfile只是memsets一个非零的缓冲区，并重复写入它。我不期望前者的性能优于dd。后者可能略微优于dd if=/dev/zero，因为它省略了读取操作，但任何性能明显更好的可能只是创建一个稀疏文件。

如果没有一个系统调用实际为文件分配空间而不写入数据(Linux和BSD缺乏这个，可能Solaris也是如此)，您可能会通过使用ftrunc(2)/truncate(1)将文件扩展到所需的大小，将文件mmap到内存中，然后将非零数据写入每个磁盘块的第一个字节(使用fgetconf查找磁盘块大小)来获得性能上的小幅改进。

2011-07-27 03:22:35

其他回答

一种方法是:如果可以保证不相关的应用程序不会以冲突的方式使用这些文件，那么只需在特定目录中创建一个大小不同的文件池，然后在需要时创建指向它们的链接。

例如，有一个文件池叫做:

/ home / bigfiles 512M-A / home / bigfiles 512M-B / home / bigfiles 1024M-A / home / bigfiles 1024M-B

然后，如果你有一个应用程序需要一个1G的文件，名为/home/oracle/logfile，执行“ln /home/bigfiles/1024M-A /home/oracle/logfile”。

如果它在单独的文件系统上，则必须使用符号链接。

可以使用A/B/etc文件来确保不相关的应用程序之间没有冲突的使用。

链接操作已经尽可能快了。

2008-11-03 03:27:24

不义之词:OTFFS提供了一个文件系统，可以提供任意大的文件系统。Exabytes是当前的限制)文件生成的内容。它只支持linux，使用纯C语言，并且处于早期alpha版本。

见https://github.com/s5k6/otffs。

2018-01-30 17:07:53

truncate -s 10M output.file

将立即创建一个10m的文件(M代表10241024字节，MB代表10001000 -与K, KB, G, GB…相同)

编辑:正如许多人指出的那样，这将不会在您的设备上物理分配文件。这样你就可以创建一个任意的大文件，而不管设备上的可用空间有多大，因为它创建了一个“稀疏”文件。

例如，注意到这个命令没有占用硬盘空间:

### BEFORE
$ df -h | grep lvm
/dev/mapper/lvm--raid0-lvm0
                      7.2T  6.6T  232G  97% /export/lvm-raid0

$ truncate -s 500M 500MB.file

### AFTER
$ df -h | grep lvm
/dev/mapper/lvm--raid0-lvm0
                      7.2T  6.6T  232G  97% /export/lvm-raid0

因此，在执行此操作时，您将推迟物理分配，直到文件被访问为止。如果将此文件映射到内存，则可能无法获得预期的性能。

但这仍然是一个需要知道的有用命令。例如，当使用文件进行基准传输时，指定的文件大小仍然会被移动。

$ rsync -aHAxvP --numeric-ids --delete --info=progress2 \
       root@mulder.bub.lan:/export/lvm-raid0/500MB.file \
       /export/raid1/
receiving incremental file list
500MB.file
    524,288,000 100%   41.40MB/s    0:00:12 (xfr#1, to-chk=0/1)

sent 30 bytes  received 524,352,082 bytes  38,840,897.19 bytes/sec
total size is 524,288,000  speedup is 1.00

2010-08-20 12:04:37

这是我在以下约束条件下所能做到的最快速度(并不快):

大文件的目标是填满磁盘，因此不能压缩。使用ext3文件系统。(fallocate不可用)

这是它的要点……

// include stdlib.h, stdio.h, and stdint.h
int32_t buf[256]; // Block size.
for (int i = 0; i < 256; ++i)
{
    buf[i] = rand(); // random to be non-compressible.
}
FILE* file = fopen("/file/on/your/system", "wb");
int blocksToWrite = 1024 * 1024; // 1 GB
for (int i = 0; i < blocksToWrite; ++i)
{
   fwrite(buf, sizeof(int32_t), 256, file);
}

在我们的情况下，这是一个嵌入式linux系统，这工作得很好，但更喜欢更快的东西。

供您参考，命令dd if=/dev/urandom of=outputfile bs=1024 count = XX速度太慢，无法使用。

2014-12-31 00:10:12

我不认为你会比dd快很多，瓶颈是磁盘;无论你怎么做，写入几百GB的数据都将花费很长时间。

But here's a possibility that might work for your application. If you don't care about the contents of the file, how about creating a "virtual" file whose contents are the dynamic output of a program? Instead of open()ing the file, use popen() to open a pipe to an external program. The external program generates data whenever it's needed. Once the pipe is open, it acts just like a regular file in that the program that opened the pipe can fseek(), rewind(), etc. You'll need to use pclose() instead of close() when you're done with the pipe.

如果你的应用程序需要文件有一定的大小，它将由外部程序来跟踪它在“文件”中的位置，并在到达“结束”时发送一个eof。

2008-11-03 04:18:35

在Linux系统上快速创建大文件

推荐文章

最新文章

标签