我有一个HTML(而不是XHTML)文档,可以在Firefox3和IE7中显示良好。它使用相当基本的CSS来设置样式,并在HTML中呈现良好的效果。

我现在正在寻找一种将其转换为PDF的方法。我尝试过:

DOMPDF:它在表格方面存在巨大问题。我分解了我的大型嵌套表,这有助于(之前它只消耗了128M的内存,然后就死了——这是我在php.ini中的内存限制),但它把表弄得一团糟,而且似乎没有图像。这些表格只是一些基本的东西,带有一些边框样式,可以在各个点添加一些线条;HTML2PDF和HTML2PS:实际上我在这方面运气更好。它呈现了一些图像(所有图像都是Google Chart URL),表格格式要好得多,但它似乎有一些复杂性问题,我还没有弄清楚,并且一直因未知的node_type()错误而死亡。不知道从这里去哪里;和Htmldoc:这在基本的HTML上似乎很好,但几乎不支持CSS,所以你必须用HTML做所有的事情(我没有意识到在Htmldoc领域还是2001年…),所以这对我来说是无用的。

我尝试了一个名为Html2Pdf Pilot的Windows应用程序,它确实做得很好,但我需要至少在Linux上运行,最好通过Web服务器上的PHP按需运行的应用程序。

我缺少什么,或者如何解决这个问题?


当前回答

就成本而言,在许多情况下,使用web服务(API)可能是更明智的方法。此外,通过外包这一过程,您可以减轻自己的基础设施/后端负担,并且-如果您使用的是信誉良好的服务-确保与调整web标准、正常运行时间、短处理时间和快速内容交付的兼容性。

我已经对目前市场上的大多数web服务进行了一些研究,请在下面找到我认为值得在这个线程中提及的API,按照价格/价值比的顺序排列。所有这些都提供预先编写的PHP类和包。

pdflayer.com-成本:$-质量:☆☆☆☆docraptor.com-成本:$$-质量:☆☆☆☆☆pdfcrowd.com-成本:$$-质量:☆☆☆

质量:

DocRaptor以高质量的引擎PrinceML为主干,显然提供了最佳的PDF质量,返回了经过高度抛光和良好转换的PDF文档。然而,pdflayer API服务在这里非常接近。Pdfcrowd不一定以质量得分,而是以处理速度得分。

成本:

pdflayer.com-如上所述,这里最具成本效益的选择是pdflaye.com,它提供100个月PDF的完全免费订阅计划,以及9.99美元至119.99美元不等的溢价订阅。每月10000份PDF文档的价格为39.99美元。

docraptor.com-提供7天免费试用期。高级订阅计划从15美元到2250美元不等。每月10000份PDF文档的价格约为300.00美元。

pdfcrowd.com-免费提供100个PDF。高级订阅计划从9美元到89美元不等。每月10000份PDF文档的价格约为49.00美元。

我已经使用了这三种方法,这段文字应该可以帮助任何人做出决定,而无需支付所有费用。本文并非为任何一种产品背书,我与任何产品都没有关联。

其他回答

我建议按照TCPDF或DOMPDF的顺序。

为什么不试试mPDF 2.0版?我用它来创建PDF文档。它工作得很好。

同时,mPDF版本为5.7,与HTML2PS/HTML2PDF相比,它得到了积极维护

但请记住,文档确实很难处理。例如,查看此页面:https://mpdf.github.io/.

使用这个库可以完成从html到pdf的非常基本的任务,但更复杂的任务需要一些时间阅读和“理解”文档。

我已经为PHP尝试了很多不同的库。我尝试过的所有列表。在我看来,TCPDF库是最佳的性能/可用性折衷方案。它的安装和使用非常简单,在中小型应用中也具有良好的性能。如果您需要高性能和非常大的PDF文档,请使用Zend_PDF模块,但要做好编码的准备!

如果你想找到一个完美的XHTML+CSS到PDF转换器库,那就忘掉它吧。因为这就像找到一个完美的浏览器(XHTML+CSS渲染引擎)。我们有吗?IE还是FF?

我在DOMPDF方面取得了一些成功。问题是,您必须修改HTML+CSS代码以符合库的工作方式。除此之外,我的成绩还不错。

见下文:

原始HTML

将HTML转换为PDF

最初在开场白中提到的HTML2PDF和HTML2PS是在谈论2009年的一个带有此链接的包

但还有更好的HTML2PDF

它是基于TCPDF的,尽管部分是法语。

您可以有在页面上重复的页眉或页脚,并有页码和总页数。参见其示例。我已经使用它三年多了,并推荐它。