我有一个HTML(而不是XHTML)文档,可以在Firefox3和IE7中显示良好。它使用相当基本的CSS来设置样式,并在HTML中呈现良好的效果。

我现在正在寻找一种将其转换为PDF的方法。我尝试过:

DOMPDF:它在表格方面存在巨大问题。我分解了我的大型嵌套表,这有助于(之前它只消耗了128M的内存,然后就死了——这是我在php.ini中的内存限制),但它把表弄得一团糟,而且似乎没有图像。这些表格只是一些基本的东西,带有一些边框样式,可以在各个点添加一些线条;HTML2PDF和HTML2PS:实际上我在这方面运气更好。它呈现了一些图像(所有图像都是Google Chart URL),表格格式要好得多,但它似乎有一些复杂性问题,我还没有弄清楚,并且一直因未知的node_type()错误而死亡。不知道从这里去哪里;和Htmldoc:这在基本的HTML上似乎很好,但几乎不支持CSS,所以你必须用HTML做所有的事情(我没有意识到在Htmldoc领域还是2001年…),所以这对我来说是无用的。

我尝试了一个名为Html2Pdf Pilot的Windows应用程序,它确实做得很好,但我需要至少在Linux上运行,最好通过Web服务器上的PHP按需运行的应用程序。

我缺少什么,或者如何解决这个问题?


当前回答

重要信息:请注意,此答案写于2009年,在2019年,它可能不是当今最具成本效益的解决方案。今天的在线替代方案比当年更好。

以下是您可以使用的一些在线服务:

PDF移位重新包装PDF图层DocRaptor公司HTMLPDFAPIHTML到PDF Rocket


看看PrinceXML。

它绝对是最好的HTML/CSS到PDF转换器,虽然它不是免费的(但是,嘿,你的编程可能也不是免费的,所以如果它为你节省了10个小时的工作,你就可以在家里自由使用了(因为你还需要考虑到,替代解决方案将需要你用正确的软件设置一个专用服务器)

哦,是的,我有没有提到这是第一个(可能也是唯一一个)实现完整ACID2的HTML2PDF解决方案?

PrinceXML示例

其他回答

我不认为php类是用css渲染xHtml页面的最佳方法。

当一个新的css规则出现时会发生什么?(很快css 3.0…)

显然,呈现html页面的最佳方式是浏览器。Firefox 3.0可以原生地以pdf格式“打印”,torissuent开发了一个扩展(命令行打印)来使用它。

无论如何,firefox作为pdf转换器仍有许多问题。。。

目前,我认为wkhtmltopdf是最好的(这是safari浏览器使用的),速度快,速度快。是的,也是开源的。。。看一看

也许您可以在将文件交给转换器之前尝试使用Tidy。如果其中一个渲染器遇到HTML问题(如未关闭的标记),可能会有所帮助。

我建议按照TCPDF或DOMPDF的顺序。

精细渲染并不意味着什么。它是否有效?

所有浏览器都尽其所能在屏幕上显示一些内容,无论输入有多糟糕。当然,他们不会做同样的事情。如果需要与FireFox相同的渲染,可以使用其渲染引擎。它有pdf生成器,但工作量很大。

我开发了一个公共API来从网页构建PDF文件。它有一个很好的PHP客户端类,使用起来非常简单。它使用wkhtmltopdf在云中渲染PDF。

不需要HTML中的任何特殊内容。在images/css/js链接中不需要绝对URL。也可以在本地主机(开发机器)上工作。

目前,该服务在4个Azure地区拥有端点:美国东部、美国西部、欧盟北部和东南亚。

它很快,因为它使用专有协议将网页内容发送到API以转换为PDF。

它是可靠的,因为所有端点都是负载平衡的。

免费帐户可用于测试或低使用率。网站上的详细信息:

https://rotativahq.com