将多个PDF文件合并/转换为一个PDF

如何将多个PDF文件合并/转换为一个大型PDF文件？

我尝试了以下操作，但目标文件的内容与预期不符：

convert file1.pdf file2.pdf merged.pdf

我需要一个非常简单/基本的命令行（CLI）解决方案。最好是我可以将合并/转换的输出直接管道化为pdf2ps（正如我之前在这里提出的问题：Linux管道化（convert->pdf2ps->lp）中所尝试的那样）。

很抱歉，我自己用谷歌找到了答案，运气不错：）

对于感兴趣的人；

我在debian服务器上安装了pdftk（pdf工具包），并使用以下命令实现了所需的输出：

pdftk file1.pdf file2.pdf cat output output.pdf

gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf file1.pdf file2.pdf file3.pdf ...

这反过来又可以直接输送到pdf2ps中。

2010-03-24 13:06:30

考虑到pdfunite是poppler的一部分，它有更高的安装机会，使用也比pdftk简单：

pdfunite in-1.pdf in-2.pdf in-n.pdf out.pdf

只需确保您记得提供out.pdf，否则它将覆盖命令中的最后一个输入文件

更安全的解决方案可能包括不存在的测试以输出文件为目标

export output_file=out.pdf && \
! test -e $output_file && \
pdfunite in-1.pdf in-2.pdf in-n.pdf $output_file

2012-07-01 07:11:53

此外，pdfjoin a.pdf.pdf将创建一个新的b-joined.pdf，其中包含a.pdf和b.pdf的内容

2013-04-18 17:24:32

尝试好的重影脚本：

gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=merged.pdf mine1.pdf mine2.pdf

或者甚至是低分辨率PDF的改进版本（感谢Adriano指出这一点）：

gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -dPDFSETTINGS=/prepress -sOutputFile=merged.pdf mine1.pdf mine2.pdf

在这两种情况下，输出分辨率都比使用convert的方式高得多：

convert -density 300x300 -quality 100 mine1.pdf mine2.pdf merged.pdf

这样，您就不需要安装任何其他东西，只需使用系统中已安装的东西即可（至少默认情况下，这两个都在我的框中）。

更新：首先感谢您的所有评论！！只是一个可能对你们有用的提示，在谷歌搜索后，我发现了一个缩小PDF大小的妙招，我用它将一个300 MB的PDF缩小到了15 MB，分辨率可以接受！所有这一切都有一个很好的脚本，这里是：

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/default -dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages -dCompressFonts=true -r150 -sOutputFile=output.pdf input.pdf

2013-10-14 10:39:43

如果要将所有下载的图像转换为一个pdf，请执行

转换img｛0..19｝.jpg幻灯片.pdf

2014-01-13 11:27:07

您可以直接使用convert命令，

e.g.

convert sub1.pdf sub2.pdf sub3.pdf merged.pdf

2014-05-17 11:33:39

我喜欢Chasmo的想法，但我更倾向于利用诸如

convert $(ls *.pdf) ../merged.pdf

提供多个源文件进行转换，从而将它们合并为一个通用的pdf。此命令将实际目录中所有具有.pdfextension的文件合并到父目录中的merged.pdf中。

2015-05-16 01:47:43

Apache PDFBoxhttp://pdfbox.apache.org/

PDF发电机此应用程序将获取pdf文档列表并将其合并，将结果保存到新文档中。

用法：java-jar pdfbox-app-x.y.z.jar PDFMerger“源PDF文件（2..n）”“目标PDF文件”

2015-11-20 05:52:33

这里有一个我使用的方法，它有效且易于实现。这将需要fpdf和fpdi库，可在此处下载：

FPDF：http://www.fpdf.org/en/download.phpFPDI：https://www.setasign.com/products/fpdi/downloads

require('fpdf.php');
require('fpdi.php');

$files = ['doc1.pdf', 'doc2.pdf', 'doc3.pdf'];

$pdf = new FPDI();

foreach ($files as $file) {
    $pdf->setSourceFile($file);
    $tpl = $pdf->importPage(1, '/MediaBox');
    $pdf->addPage();
    $pdf->useTemplate($tpl);
}

$pdf->Output('F','merged.pdf');

2016-03-18 23:26:45

您可以使用sejda控制台，免费且开源。解压缩并运行sejda console merge-f file1.pdf file2.pdf-o merged.pdf

它保留了书签、链接注释、acroforms等。实际上，它有很多选项可以使用，只需运行sejda console merge-h即可查看所有选项。

2017-02-02 18:44:13

我支持pdfunite的建议。然而，当我试图合并>2k个PDF文件时，我得到了参数列表太长的错误。

我求助于Python和两个外部包：PyPDF2（处理所有与PDF相关的事情）和natsort（对目录的文件名进行“自然”排序）。如果这可以帮助某人：

from pathlib import Path
from PyPDF2 import PdfMerger
import natsort

DIR = Path("dir-with-pdfs/")
OUTPUT = "output.pdf"

paths = DIR.glob("*.pdf")
paths = natsort.natsorted(paths)

merger = PdfMerger()

for path in paths:
    merger.append(path)

merger.write(OUTPUT)

2017-06-13 18:03:00

使用PyPI中的pdftools。

下载tar.gz文件并解压缩，然后运行如下命令

python pdftools-1.1.0/pdfmerge.py -o output.pdf -d file1.pdf file2.pdf file3

在运行上述命令之前，应该安装python3

此工具支持以下内容

添加插入去除旋转分裂合并拉链

你可以在GitHub上找到更多细节，它是开源的

2017-07-06 10:34:56

作为PyMuPDF（MuPDF的Python绑定）的开发人员之一，我有偏见。

你可以很容易地用它做你想做的事情（还有更多）。骨架代码的工作原理如下：

#-------------------------------------------------
import fitz         # the binding PyMuPDF
fout = fitz.open()  # new PDF for joined output
flist = ["1.pdf", "2.pdf", ...]  # list of filenames to be joined

for f in flist:
    fin = fitz.open(f)  # open an input file
    fout.insertPDF(fin) # append f
    fin.close()

fout.save("joined.pdf")
#-------------------------------------------------

仅此而已。有几个选项可用于仅选择页面范围、维护联合目录、反转页面顺序或更改页面旋转等。

我们在PyPi上。

2018-01-15 21:22:54

pdfunite可以合并整个PDF。例如，如果您想要file1.pdf中的第2-7页和file2.pdf中的1,3,4页，则必须使用pdfsepart将文件拆分为单独的pdf，以便为每个页面提供给pdfunite。

此时，您可能需要一个具有更多选项的程序。qpdf是我发现的处理PDF的最佳工具。pdftk更大、更慢，Red Hat/Fedora不打包它，因为它依赖于gcj。其他PDF实用程序具有Mono或Python依赖关系。我发现qpdf生成的输出文件比使用pdfseparate和pdfunite将页面组装成30页的输出PDF要小得多，分别为970kB和16450kB。因为它提供了更多的选项，qpdf的命令行并没有那么简单；合并文件1和文件2的原始请求可以使用

qpdf --empty --pages file1.pdf file2.pdf -- merged.pdf

2018-06-28 10:46:14

如果您有多个文件并且不想逐一键入名称，这是最简单的解决方案：

qpdf --empty --pages *.pdf -- out.pdf

2018-12-13 03:36:43

虽然它不是命令行解决方案，但它可能会帮助macos用户：

选择您的PDF文件右键单击突出显示的文件选择快速操作>创建PDF

2020-04-09 22:29:44

你可以看到使用免费和开源的pdftools（免责声明：我是它的作者）。

它基本上是Latex pdfpages包的Python接口。

要逐个合并pdf文件，您可以运行：

pdftools --input-file file1.pdf --input-file file2.pdf --output output.pdf

要将目录中的所有pdf文件合并在一起，可以运行：

pdftools --input-dir ./dir_with_pdfs --output output.pdf

2020-05-20 19:56:30

这里是一个检查合并错误的Bash脚本。

我遇到的问题是，一些PDF合并产生了一些错误消息。由于查找腐败的PDF文件需要反复尝试，我为此编写了一个脚本。

以下Bash脚本逐一合并文件夹中的所有可用PDF，并在每次合并后显示成功状态。只需将其与PDF一起复制到文件夹中，然后从那里执行。

#!/bin/bash

PDFOUT=_all_merged.pdf
rm -f "${PDFOUT}"

for f in *.pdf
do
  printf "processing %-50s" "$f  ..." >&2
  if [ -f "$PDFOUT" ]; then
    # https://stackoverflow.com/questions/8158584/ghostscript-to-merge-pdfs-compresses-the-result
    #  -dPDFSETTINGS=/prepress
    status=$(gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile="${PDFOUT}.new" "${PDFOUT}" "$f" 2> /dev/null)
    if [ "$status" ]
    then
      echo "gs ERROR: $status" >&2
    else
      echo "successful" >&2
    fi
    mv "${PDFOUT}.new" "${PDFOUT}"
  else
    cp "$f" "${PDFOUT}"
    echo "successful" >&2
  fi
done

示例输出：

processing inp1.pdf  ...                                     successful
processing inp2.pdf  ...                                     successful

2020-09-02 11:56:29

另一个有用的选项是，您还需要选择要合并的文档中的页面：

pdfjoin image.jpg '-' doc_only_first_pages.pdf '1,2' doc_with_all_pages.pdf '-'

它附带包texlive额外实用程序

2021-01-13 19:11:55

如果您想使用Ghostscript将所有PDF文件连接到一个目录中，可以使用find来实现这一点。这里有一个例子

find . -name '*.pdf' -exec gs -o -sDEVICE=pdfwrite -dPDFSETTINGS=/prepress -sOutputFile=../out.pdf {} +

将在当前目录中找到所有pdf，并在父目录中创建out.pdf。如果他们正在寻找一种快速的方法来使用ghostscript创建整个目录，可能会很有用。

2021-02-05 18:19:08

PdfCpu非常有用：

pdfcpu merge c.pdf a.pdf b.pdf

https://pdfcpu.io/core/merge

2021-03-07 16:52:46

pdfconcat -o out.pdf 1.pdf 2.pdf

``pdfconcat是一个用ANSI C编写的小型快速命令行实用程序，可以将多个PDF文件连接（合并）成一个长PDF文档

2021-03-09 21:55:10

我从终端使用了qpdf，在Windows（Moaxterm）和Linux上为我工作，例如，在新文件C.pdf中加入A.pdf和B.pdf的命令是：

qpdf--空--oficios/A.pdfinformes/B.pdf--salida/C.pdf页面

如果需要更多文档[https://net2.com/how-to-merge-or-split-pdf-files-on-linux/][1]

2021-03-14 02:06:36

将多个PDF文件合并/转换为一个PDF

推荐文章

最新文章

标签