使用 javascript 屏幕延迟抓取网站 [关闭]

2024-04-20

我正在尝试抓取一个有瞬间 JavaScript 延迟的网站。

我目前正在使用 python 进行抓取。每当我“获取”页面时,JavaScript 延迟尚未完成,并且尚未完全加载新的 dom。

我该如何抓取这样的pge?


您可以扩展 Mozilla 来构建一个网络爬虫,它可以充分利用网络浏览器的功能。加载所有数据并构建 DOM 后,您可以使用 XSLT 从 DOM 中提取所需的数据。如果 DOM 在初始加载后动态更改,您可以采取一些方法来等待更改。访问http://www.gooseker.com http://www.gooseeker.com了解更多信息。 GooSeeker 为所有人免费发布了一个类似的工具。大部分代码都是javascript的,可读性强,从中你可以了解它是如何运行的。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 javascript 屏幕延迟抓取网站 [关闭] 的相关文章

随机推荐