2023-10-30 08:00:01

网站截图

有什么方法可以用PHP截图一个网站,然后保存到一个文件?


当前回答

如果你不想使用任何第三方工具,我遇到了一个简单的解决方案,那就是使用谷歌页面洞察api。

只需要调用它的api与params截图=true。

https://www.googleapis.com/pagespeedonline/v1/runPagespeed?
url=https://stackoverflow.com/&key={your_api_key}&screenshot=true

对于移动站点视图传递&策略=移动参数,

https://www.googleapis.com/pagespeedonline/v1/runPagespeed?
url=http://stackoverflow.com/&key={your_api_key}&screenshot=true&strategy=mobile

演示。

其他回答

Cutycapt保存网页的大多数图像格式(jpg,png..)下载它从你的突触,它比wkhtmltopdf工作得更好

我发现这是最好和最简单的工具:ScreenShotMachine。这是一项付费服务,但你可以得到100张免费截图,你还可以花20美元再买2000张,所以这是一笔相当划算的交易。它有一个非常简单的用法,你只是使用一个URL,所以我写了这个小脚本来保存一个基于它的文件:

<?php
  $url = file_get_contents("http://api.screenshotmachine.com/?key={mykey}&url=https://stackoverflow.com&size=X");

  $file = fopen("snapshots/stack.jpg", "w+");
  fwrite($file, $url);
  fclose($file);
  die("saved file!");
?>

他们有一个非常好的文档,所以你一定要看看。

不直接。像Selenium这样的软件有这样的特性,可以用PHP控制,但有其他依赖(比如在你想要截图的浏览器的计算机上运行基于java的服务器)

有一些方法可以在PHP中实现这一点,但实际上,最好将其委托给非基于PHP的API,您可以自己构建,也可以付费购买。许多人已经在答案中列出了截图api,你可以使用其中任何一个来实现这一点。我自己的截图API经过了非常好的测试,涵盖了大多数API没有涵盖的许多渲染情况,但对大多数人来说,这是多余的,老实说。

我的建议是使用Puppeteer构建自己的API,这是目前构建截图解决方案的规范解决方案。我的服务是建立在Puppeteer的基础上的,对于大多数基本的用例来说,它真的工作得很好。

您可以使用https://www.npmjs.com/package/chrome-aws-lambda之类的东西在AWS或GCP上构建一个无服务器的Puppeteer解决方案,这是一个优秀的无服务器Puppeteer包,它预装了Chromium。

有很多选择,它们都有各自的优点和缺点。以下是按实现难度排序的选项列表。

选项1:使用API(最简单)

ApiFlash(基于chrome) EvoPDF(有html选项) Grabzit ...

Pros

执行Javascript 近乎完美渲染 正确使用缓存选项时快速 缩放由api处理 精确计时,视口,… 大多数时候,他们提供的是免费方案

Cons

如果你打算经常使用它们,就不是免费的

选项2:使用众多可用库中的一个

dom-to-image Wkhtmltoimage(包含在wkhtmltopdf工具中) phpwkhtmltopdf ...

Pros

大多数时候,转换是相当快的

Cons

坏的呈现 不执行javascript 不支持最近的网页功能(FlexBox,高级选择器,网页字体,盒子大小,媒体查询,HTML5标签…) 有时不容易安装 缩放复杂

选项3:使用PhantomJs和包装器库

PhantomJs php- PhantomJs (phphtomjs包装器库) ...

Pros

执行Javascript 很快

Cons

坏的呈现 PhantomJs已弃用,不再维护。 不支持最近的网页功能(FlexBox,高级选择器,网页字体,盒子大小,媒体查询,HTML5标签…) 缩放复杂 不那么容易使它工作,如果有图像要加载…

选项4:使用Chrome Headless和一个包装器库

Chrome无头 chrome-devtools-protocol puphpeteer ...

Pros

执行Javascript 近乎完美渲染

Cons

要得到想要的结果并不容易: 页面加载时间 代理集成 自动滚动 ... 缩放复杂 相当慢,甚至更慢,如果html包含外部链接

免责声明:我是ApiFlash的创始人。我尽力提供了一个诚实而有用的答案。