如何将多个PDF文件合并/转换为一个大型PDF文件?

我尝试了以下操作,但目标文件的内容与预期不符:

convert file1.pdf file2.pdf merged.pdf

我需要一个非常简单/基本的命令行(CLI)解决方案。最好是我可以将合并/转换的输出直接管道化为pdf2ps(正如我之前在这里提出的问题:Linux管道化(convert->pdf2ps->lp)中所尝试的那样)。


当前回答

您可以使用sejda控制台,免费且开源。解压缩并运行sejda console merge-f file1.pdf file2.pdf-o merged.pdf

它保留了书签、链接注释、acroforms等。实际上,它有很多选项可以使用,只需运行sejda console merge-h即可查看所有选项。

其他回答

Apache PDFBoxhttp://pdfbox.apache.org/

PDF发电机此应用程序将获取pdf文档列表并将其合并,将结果保存到新文档中。

用法:java-jar pdfbox-app-x.y.z.jar PDFMerger“源PDF文件(2..n)”“目标PDF文件”

虽然它不是命令行解决方案,但它可能会帮助macos用户:

选择您的PDF文件右键单击突出显示的文件选择快速操作>创建PDF

PdfCpu非常有用:

pdfcpu merge c.pdf a.pdf b.pdf

https://pdfcpu.io/core/merge

这里是一个检查合并错误的Bash脚本。

我遇到的问题是,一些PDF合并产生了一些错误消息。由于查找腐败的PDF文件需要反复尝试,我为此编写了一个脚本。

以下Bash脚本逐一合并文件夹中的所有可用PDF,并在每次合并后显示成功状态。只需将其与PDF一起复制到文件夹中,然后从那里执行。

#!/bin/bash

PDFOUT=_all_merged.pdf
rm -f "${PDFOUT}"

for f in *.pdf
do
  printf "processing %-50s" "$f  ..." >&2
  if [ -f "$PDFOUT" ]; then
    # https://stackoverflow.com/questions/8158584/ghostscript-to-merge-pdfs-compresses-the-result
    #  -dPDFSETTINGS=/prepress
    status=$(gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile="${PDFOUT}.new" "${PDFOUT}" "$f" 2> /dev/null)
    if [ "$status" ]
    then
      echo "gs ERROR: $status" >&2
    else
      echo "successful" >&2
    fi
    mv "${PDFOUT}.new" "${PDFOUT}"
  else
    cp "$f" "${PDFOUT}"
    echo "successful" >&2
  fi
done

示例输出:

processing inp1.pdf  ...                                     successful
processing inp2.pdf  ...                                     successful

pdfunite可以合并整个PDF。例如,如果您想要file1.pdf中的第2-7页和file2.pdf中的1,3,4页,则必须使用pdfsepart将文件拆分为单独的pdf,以便为每个页面提供给pdfunite。

此时,您可能需要一个具有更多选项的程序。qpdf是我发现的处理PDF的最佳工具。pdftk更大、更慢,Red Hat/Fedora不打包它,因为它依赖于gcj。其他PDF实用程序具有Mono或Python依赖关系。我发现qpdf生成的输出文件比使用pdfseparate和pdfunite将页面组装成30页的输出PDF要小得多,分别为970kB和16450kB。因为它提供了更多的选项,qpdf的命令行并没有那么简单;合并文件1和文件2的原始请求可以使用

qpdf --empty --pages file1.pdf file2.pdf -- merged.pdf