PHP爬取一个网站，该网站正在使用cloudflare

2023-12-01

我想从网站（不是我自己的网站）中抓取一些特定值（例如新闻文本）。

file_get_contents()不工作，可能被 php.ini 阻止。

所以我尝试用curl来做到这一点，问题是：
我得到的只是来自 cloudflare 的重定向文本。
我的爬虫应该做类似的事情：
转到页面 -> 等待 5 秒 cloudflare 重定向 -> 卷曲页面。

有什么想法如何在 cloudflare 等待时间后抓取页面吗？（PHP 语言）

编辑：所以我尝试了很多东西，问题仍然是一样的..
更具体地说：它只抓取 cloudflare 重定向页面。（所以我得到一个重定向到主机的页面，cloudflare在前面。当我在本地主机上卷曲时，它需要本地主机，所以重定向显然不起作用。）有没有办法在5秒“卷曲”后开始保存返回数据？

“转到页面 -> 等待 5 秒 cloudflare 重定向 -> 卷曲页面。”

5 秒插页式页面实际上需要启用 JavaScript 和 cookie，然后访问者才能通过检查，如果您使用爬虫或机器人访问该网站，这可能不起作用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

PHP爬取一个网站，该网站正在使用cloudflare 的相关文章

禁用 WooCommerce 手动/编辑订单的电子邮件通知

需要 WooCommerce 专业知识我需要禁用手动创建的订单的电子邮件通知我必须使用处理状态由于处理订单状态的自定义挂钩我无法创建自定义状态理想情况下手动订单页面中可以勾选一个复选框勾选后它将禁止在每种状态下向客户发送电子
更改 Woocommerce 中“我的帐户”页面上的标题

我见过大量有关如何使用 WooCommerce 我的帐户仪表板重新排序更改导航和页面的示例但我一生都无法弄清楚如何更改每个部分的主要标题我的帐户订单下载地址等我已经搜索过模板但没有任何乐趣我尝试使用条件 php 注释来回显
在 PHP 中包含 PHP 文件

我有一个网站它运行 PHP if 语句来根据附加文件的类型即 Jpg Txt MP4 显示内容所以我显示 TXT 文件的代码是 if post attachment txt display attachment div class d
Smarty 如果 URL 包含

使用 Smarty 标签我想确定 URL 是否包含单词例如 if smarty get page contains product php 我知道 contains 不存在但是我怎样才能轻松地编写类似的东西来实现上述代码呢所有 PHP
使用 ImageMagick 和 PHP 将 PNG 转换为 JPG 并将透明背景设置为白色

将图像从 PNG 转换为 JPEG 时如何使用 ImageMagick 带有 php 扩展将透明背景设置为白色在撰写本文时您尚未指定正在使用哪个扩展但如果您使用命令行则命令将是 convert image png backgro
未传递“client_reference_id”参数

我使用 Stripe Checkout Stripe 版本 2016 07 06 我想通过参数 client reference id 恢复个性化数据但在 JSON 中当我有金额或电子邮件时我找不到它我是在测试环境中你能帮我吗先
如何将我的 init 函数中的代码集中到所有控制器中？

public function init this gt view gt user Zend Auth getInstance gt getIdentity this gt view gt siteName Zend Registry ge
检查 PHP 中的字符串长度

我有一个长度为 141 个字符的字符串使用下面的代码我有一个if如果字符串大于或小于 140 则语句返回一条消息 libxml use internal errors TRUE dom new DOMDocument dom gt loa
如何在多次尝试后延迟登录尝试 (PHP)

我正在开发一个用 PHP 构建的相当大的网站该网站可能会有很多用户我正在寻找一种方法来保护登录屏幕免受自动尝试的影响我已经在注册表中添加了验证码检查但还想进一步强化网站据我所知 StackOverflow 上也有类似的问题而且我
WordPress 包含 SVG 文件错误

我使用 PHP 和 WordPress 在本地主机上我可以毫无问题地包含 SVG 文件但在实时服务器上我尝试包含一个 SVG 文件以便能够使用 CSS 对其进行样式设置我收到此错误消息 Parse error syntax erro
使用 Instagram Basic Display API 时出现“无效平台应用程序”错误

我正在尝试使用 Instagram Basic 显示 API 但是当我发布授权代码以获取访问令牌时我不断收到以下错误 error type OAuthException 代码 400 error message 平台应用无效我正在遵循此
如何纠正这个非法字符串偏移？

我收到此错误警告第 32 行 home mysite public html wp content themes evento lib php extra class php 中的非法字符串偏移 type 我意识到文件中的这部分代码是错
对 SimpleXML 数据进行排序和分组

我正在对 XML 文件中的出版物数据进行排序和分组我目前使用的方法效果很好大部分情况下尽管我觉得有一种更有效的方法来完成我想要完成的任务以下是目标节点的示例
Facebook 应用程序无法获取会话

我正在 Heroku 上为 Facebook 开发一个非常基本的 PHP 应用程序它显示非常基本的用户信息如姓名个人资料图片但该应用程序在 getToken 方法中停止我在登录我的个人资料后尝试了该应用程序但仍然出现相同的消息
Mysqli 更新抛出 Call to a member function bind_param() 错误[重复]

这个问题在这里已经有答案了我有一个 70 80 字段表单需要插入到表中因此我首先根据表单中的输入名称在数据库中创建了一个表而不是手动创建一个巨大的插入语句这是我使用的代码创建更改表 function createTable ar
PHP print_r() 中 _r 的含义是什么？

我见过这个答案 https stackoverflow com questions 13103410 what does r suffix mean就这样但我不确定它对于 PHP 是否相同如果是可重入的含义是什么 From PHP n
如何通过php获取网页的Open Graph协议？

PHP 有一个简单的命令来获取网页的元标记 get meta tags 但这仅适用于具有名称属性的元标记然而开放图谱协议如今变得越来越流行从网页获取 opg 值的最简单方法是什么例如我看到的基本方法是通过 cURL 获取页面并使用
如何在 phalcon 框架中同时连接多个数据库在模型类中同时使用两个而不仅仅是一个

在我的代码中我有两个数据库ABC and XYZ 我想在同一模型中使用两个数据库而不是 phalcon 中的解决方案是什么如何为此实现多个数据库连接 one
反向引用在 PHP 中不起作用

最近我一直在研究更多的是在实践中说实话正则表达式我注意到他的力量我提出的这个要求 link https stackoverflow com questions 30380397 take the text up to a speci
如何使用 php 将 *.xlsb 转换为数组或 *.csv

我正在尝试转换 xlsb文件到php array or csv文件或至少 xls 我尝试使用PHPExcel 但看起来它无法识别该文件中的内容我注意到你可以重命名 xlsb文件到 zip文件然后使用命令行解压缩unzip zip 之

随机推荐

如何加载 Sass::Script::Functions 模块的扩展？

我正在尝试根据此建议扩展 Sass Script Functions 模块 https gist github com 481261 dd07a52829886ab1ad0875a8895f0100c4b925ab 问题是我应该将 sas
交换两个字符串指针

我必须在 C 中使用 char 并且我想通过仅交换指针来在它们之间交换到数组而不是一次一个字符所以我写了这段代码 include
如何使用 sed/grep 提取两个单词之间的文本？

我正在尝试输出一个包含字符串中两个单词之间的所有内容的字符串 input Here is a String output is a Using sed n Here String p 包括端点但我不想包括它们 GNU grep 还可以支持
如何获取tf.exe（TFS命令行客户端）？

要获取 tf exe 程序我需要安装的最少软件数量是多少你需要安装团队探索者最好安装与您正在使用的 TFS 版本相匹配的 Team Explorer 版本例如如果您使用的是 TFS 2010 则安装 Team Explorer 20
如何使用绝对路径获取有关 git 存储库的信息

我正在编写一些脚本来获取有关我在本地设置的 git 存储库的信息使用一个简单的例子可以最好地解释这一点 machine anon mkdir test machine anon cd test machine test anon mkdi
创建用于静态初始化布局描述的 API/元编程 DSL

我需要创建一个 C 元编程 DSL API 来描述通用数据布局我想要静态初始化数据结构描述即没有动态内存分配最好在 ROM 部分分配我还不太熟悉 C 11 功能但我知道与提供的旧标准相比您可以在初始化静态方面做更多的事情我
如何在 tkcalendar (Python) 中获取 DateEntry 的选定日期？

我有一个 tkcalendar 它是日历 DateEntry 的预定义小部件并且我正在尝试获取用户为 DateEntry 选择的日期而可以使用以下方法提取日历小部件的选定日期选择获取但我找不到 DateEntry 的任何内容我尝
可变参数模板的声明点

什么时候可变参数模板被视为声明这可以在 clang 3 4 下编译但不能在 g 4 8 2 下编译 template
在设备上运行 Android systrace

我无法运行名为 systrace pl 的 Android SDK 工具因为出现如下错误 error opening sys kernel debug tracing options overwrite No such file or d
如何使用MYSQL中的查询删除2个字符之间的文本

我有一个名为描述字段的表其中包含如下文本 Description This is a text a blah a br img This is b second b a row a 我想删除之间的所有内容 lt and gt 所需输
如何以编程方式在 iOS 中从右向左移动文本

我想在我的应用程序中显示一些文本例如移动文本从右到左滚动动画如何以编程方式执行此操作 I took UIViewcontroller 我正在开发AVAudioplayer 所以在顶部UIViewController文本将从右向左移动
无法连接到启用了 SSL 的 GCP 中的 Redis

我在用Spring boot starter redis连接到 Redis 的依赖项下面是我的 gradle 依赖项的片段 dependencies implementation org springframework boot spri
为单源最短路径问题设计一个算法，运行时间为 O(k(|V|+|E|))

假设我们有一个有向图G V E 具有潜在的正边和负边长度但没有负循环让s V是给定的来源顶点如何设计实时运行的单源最短路径问题算法O k V E 如果从 s 到任何其他顶点的最短路径最多花费k edges 这是 O k V E 方
Laravel 中关系的计数关系

假设我有一个Conversation像这样的模型 class Conversation extends Model public function questions return this gt hasMany App Question
使用 xlwt 将列表列表写入 Excel 文件

我有一个列表例如 u email u salutation u firstname u lastname u remarks None None None None None u email protected u Mr u Daniel
从 mongodb 游标流式传输到 Node.js 中的 Express 响应

我正在尝试所有花哨的 node js mongodb express 平台并偶然发现了一个问题 app get tag tag function req res var tag req params tag console log got
存储过程中不允许加载数据

我有一个案例每下午6点自动将数据导入mysql 要导入的数据是 data txt 我在mysql中创建是这样的 CREATE EVENT EVENT NAME ON SCHEDULE EVERY 18 00 00 DAY DO LOAD
如果找到总和值，则搜索重复项

我有这个数组 data 0 gt date gt 2018 09 12 department gt 12 country gt 14 total gt 12 1 gt date gt 2018 09 12 department gt 12
删除 CosmosDB 的 SQL [重复]

这个问题在这里已经有答案了是否可以在 CosmosDB 中使用 SQL 从文档集合中删除我正在寻找类似于 SELECT 的删除 SQL 如下所示 SELECT FROM Families f WHERE f id AndersenFam
PHP爬取一个网站，该网站正在使用cloudflare

我想从网站不是我自己的网站中抓取一些特定值例如新闻文本 file get contents 不工作可能被 php ini 阻止所以我尝试用curl来做到这一点问题是我得到的只是来自 cloudflare 的重定向文本我的爬虫

PHP爬取一个网站，该网站正在使用cloudflare

PHP爬取一个网站，该网站正在使用cloudflare 的相关文章

随机推荐

热门标签