我试图在Puppeteer中传递一个变量到page.evaluate()函数,但当我使用以下非常简化的示例时,变量evalVar是未定义的。我找不到任何例子来构建,所以我需要帮助将该变量传递到page

我正在练习“使用Python进行网络抓取”的代码,我一直有这个证书问题:错误是:顺便说一句,我也在练习scrapy,但一直得到的问题:命令找不到:scrapy(我尝试了各种在线解决方案,但没有一个工作

我试图开发一个简单的网页刮板。我想提取没有HTML代码的文本。它适用于普通HTML,但不适用于JavaScript代码添加文本的某些页面。例如,如果一些JavaScript代码添加了一些文本,我不能看

在我的项目中,我需要谷歌缓存年龄作为重要信息添加。我试图搜索谷歌缓存年龄的来源,也就是说,从谷歌上次重新索引所列页面以来的天数。我在哪里可以得到谷歌缓存年龄?

我有一个相当大的音乐网站,有一个很大的艺术家数据库。我一直注意到其他音乐网站在窃取我们网站的数据(我在这里和那里输入假艺人的名字,然后进行谷歌搜索)。如何防止屏幕刮擦?这可能吗?

我试图把可能的解决方案的浏览器自动测试套装和无头浏览器平台能够抓取。浏览器测试/抓取:Selenium——浏览器自动化的多语言旗舰,Python、Ruby、JavaScript、c#、Haskell等

我在使用Beautifulsoup解析带有“class”属性的HTML元素时遇到了麻烦。代码看起来像这样我在脚本完成后的同一行上得到一个错误。如何消除这个错误呢?