无法在 phantomjs 中延迟加载

2024-06-19

我正在尝试从链接中抓取一些信息(http://www.myntra.com/women-sarees?nav_id=606 http://www.myntra.com/women-sarees?nav_id=606)涉及延迟加载。下面是我的代码片段:

window.setInterval(function() {
    //var count returns the visibility of the div that checks for lazyloading
    if((count == 'none')) { // more products to be loaded
        page.evaluate(function() {
            // Scrolls to the bottom of page
            window.document.body.scrollTop = document.body.scrollHeight;
        });
        page.render('myn'+k+'.png');
    }
    else { // Found
        //Do what you want
        //console.log('len123');
}, 5000); // Number o ms to wait between scrolls

但我只加载了前 6 行。我不明白我哪里错了。


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

无法在 phantomjs 中延迟加载 的相关文章

  • 从动态服务器中抓取 html 列表数据

    哈喽大家好 抱歉提出转储问题 这是我最后的手段 我发誓我尝试了无数其他 Stackoverflow 问题 不同的框架等 但这些似乎没有帮助 我有以下问题 一个网站显示一个数据列表 前面有大量的 div li span 等标签 它是一个很大的
  • heroku 上 phantomjs 的分页内部支持

    我有一个 NodeJS 应用程序 使用 PhantomJS 生成 PDF 文件 我的应用程序已部署到 Heroku 并且我正在使用this https github com stomita heroku buildpack phantomj
  • 有没有办法以编程方式下载网页的部分内容,而不是整个 HTML 正文?

    我们只需要 nytimes com technology 上的 HTML 文档中的特定元素 该页面包含许多文章 但我们只想要文章的标题 该标题位于 如果我们使用 wget cURL 或任何其他工具或某些包 例如Python 中的请求 htt
  • 带有 jsessionid 的 R 网络抓取工具

    我正在 R 中测试一些网页抓取脚本 我已经阅读了很多教程 文档并尝试了不同的方法 但到目前为止还没有成功 我试图抓取的网址是this one http www dataescolabrasil inep gov br dataEscolaB
  • 点击事件触发后不执行任何操作

    当我触发一个 click 在 puppeteer 中的非无头模式下发生的事件 没有任何反应 甚至没有错误 非无头模式 因此我可以直观地监视正在单击的内容 const scraper test async gt let browser pag
  • 无法在我的抓取工具中设置超时选项以防止无限循环

    我已经使用 IE 在 vba 中编写了一个脚本 在其搜索框中的网页中启动搜索 通过点击搜索按钮根据搜索填充结果 网页加载它是searchbox几秒钟后它就会打开 但是 我的下面的脚本可以处理这个障碍并以正确的方式执行搜索 现在 我有一个稍微
  • 使用 VBA 的下拉菜单

    我需要使用 VBA 从下拉菜单中选择特定选项 我怎样才能做到这一点 链接到我们试图从中提取的网页 IE document getElementsByName down count click 我尝试过的代码 Full Module Priv
  • 无法使用 BeautifulSoup4 (Python 3) 抓取特定表

    我想从 Ligue 1 足球网站上抓取一张表格 具体来说 该表包含有关卡片和裁判的信息 http www ligue1 com LFPStats stats arbitre competition D1 http www ligue1 co
  • 等待网页完全加载,然后再使用 python 请求进行抓取

    我目前正在尝试从 LinkedIn 上的特定页面抓取数据 我有一个能够登录 LinkedIn 的脚本 但当我尝试访问包含数据的页面时遇到了障碍 当我打电话时requests get data url 我最终得到了 LinkedIn 加载屏幕
  • 卸载/销毁 Angular 延迟加载组件

    我的设置与此处找到的帖子类似http ify io lazy loading in angularjs http ify io lazy loading in angularjs 处理 Angular 中我的应用程序的各种组件的延迟加载 我
  • PhantomJS 网页内存消耗?

    是否有一种编程方式 因为我想在运行时自动执行 方式来查看网页在通过 PhantomJs 运行时使用了多少内存 我也在使用 casperjs 如果这有帮助的话 我已经搜索了很多但没有找到任何方法 PhantomJs 使用 QtWebKit 因
  • 如何处理数据库中的巨大结果集

    我正在设计一个多层数据库驱动的 Web 应用程序 SQL 关系数据库 用于中间服务层的 Java 用于 UI 的 Web 语言其实并不重要 中间服务层执行数据库的实际查询 用户界面只是要求某些数据 并不知道它是由数据库支持的 问题是如何处理
  • 使用 Angular 下载具有动态 src 的脚本

    Angular 提供了通过动态名称动态加载模板的方法ng include 该部分中的内联 JS 和 CSS 可以正常加载 但没有一个好的方法来下载带有动态 url 的脚本 我们需要下载脚本 相对于调用它们的 html 部分的路径 即我们有一
  • Jasmine/PhantomJs 规格运行程序

    我无法使用 phantomJs 运行测试 吞咽任务 var jasminePhantomJs require gulp jasmine2 phantomjs gulp task test function return gulp src S
  • NHibernate:多对一和惰性

    关于 NHibernate 1 2 webapp C aspnet 3 5 和延迟加载 我不明白 也找不到一些明确的答案 多对一是否支持延迟加载 假设我们有一些Person对象和一个Squeletton目的 这两个对象都很大 具有很多属性
  • Scrapy解析javascript

    我的页面上有一个 JavaScript 代码 如下所示 new Shopify OptionSelectors product select product id 185310341 title 10 Design Siyah u0026
  • 抓取问题:“检查元素”与“查看页面源代码”不同

    我正在尝试对一个网页进行网络抓取 该网页内部包含多个选项卡 当我单击所需的选项卡并显示其内容后 首先出现两个问题 1 网页地址不会更改 并且所有选项卡都相同 2 当我使用浏览器 firefox和chrome 的 查看页面源 查看页面源时 所
  • 如何使用 phantomjs 使用文件中的持久 cookie

    我需要一些身份验证才能访问特定的网址 在浏览器中我只需要登录一次 至于其他可以使用cookie中的会话id的相关url不需要转到登录页面 同样 我可以使用 cookie 文件中生成的 cookie cookies file cookies
  • 延迟加载属于主记录一部分的字段

    我是 NHibernate 的新手 所以如果这是一个愚蠢的问题 我会提前请求原谅 我已经用谷歌搜索了它并搜索了文档 并且正在围绕轴进行所有操作 我正在维护 增强一个现有应用程序 该应用程序使用 NHibernate 作为相对简单的表 该表大
  • Python,多线程,获取网页,下载网页

    我想在一个站点批量下载网页 我的 urls txt 文件中有 5000000 个 url 链接 大约有300M 如何让多线程链接这些网址并下载这些网页 或者如何批量下载这些网页 我的想法 with open urls txt r as f

随机推荐