file_get_contents() 给我 403 Forbidden

2023-12-11

我有一个合作伙伴创建了一些内容供我抓取。
我可以使用浏览器访问该页面，但是当尝试使用file_get_contents，我得到一个403 forbidden.

我尝试过使用stream_context_create，但这没有帮助——可能是因为我不知道里面应该放什么。

1）有什么办法可以抓取数据吗？
2) 如果否，并且合作伙伴不允许配置服务器以允许我访问，那么我该怎么办？

我尝试使用的代码：

$opts = array(
  'http'=>array(
    'user_agent' => 'My company name',
    'method'=>"GET",
    'header'=> implode("\r\n", array(
      'Content-type: text/plain;'
    ))
  )
);

$context = stream_context_create($opts);

//Get header content
$_header = file_get_contents($partner_url,false, $context);

这不是您的脚本中的问题，而是您合作伙伴 Web 服务器安全性中的一个功能。

很难确切地说是什么阻碍了你，很可能是某种阻碍抓取的因素。如果您的合作伙伴可以访问他的网络服务器设置，这可能有助于查明。

您可以做的是通过设置用户代理标头来“伪造网络浏览器”，使其模仿标准网络浏览器。

我建议使用 cURL 来执行此操作，并且很容易找到执行此操作的良好文档。

    // create curl resource
    $ch = curl_init();

    // set url
    curl_setopt($ch, CURLOPT_URL, "example.com");

    //return the transfer as a string
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');

    // $output contains the output string
    $output = curl_exec($ch);

    // close curl resource to free up system resources
    curl_close($ch);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

html

httpheaders

screenscraping

file_get_contents() 给我 403 Forbidden 的相关文章

使用 PHP Selenium Webdriver 单击下拉菜单中的选项？

我正在使用 PHP Selenium Webdriver 包装器Facebook https github com facebook php webdriver 任何人都可以给我一个如何单击或从选择下拉菜单中选择选项的示例吗我已经尝试过这
编辑 HTACCESS 文件以防止直接访问特定文件夹中的特定文件

我试图阻止直接访问子文件夹中的特定文件我意识到这个论坛上有很多描述类似问题的主题但是我的似乎有点尴尬由于我已经存在 HTACCESS 文件这是文件的文件路径 www example com PRINCIPAL PROJECTS m
如何倾斜 div 并保持背景图像不倾斜

我已经花了几个小时了所以希望有人能提供帮助我有一个网站其中大部分 div 都是倾斜的大多数 div 都包含背景图像现在我已经让 div 倾斜了内容完美地位于其中唯一的问题是背景图像它与父级一起倾斜我用谷歌搜索了很多但找不
使用 PHP PayPal REST API 退款？

我正在开发一个集成到 PayPal 的 REST API 中的 PHP 应用程序我正确处理了事务并将事务 ID 保存到 MySQL 数据库中我现在正在尝试退款但无法让它停止给出传入 JSON 请求未映射到 API 请求错误有人对
通过 URL 指定控制器类与为每个控制器编写一个脚本相比，有何优缺点？

今年夏天我安装了两个不同的 PHP 系统每个都使用两种不同的方法方法 1 每个任务一个 PHP 文件该方法需要一个PHP为每个主要任务创建文件例如我的上传脚本可以通过http www domain com upload php O
Modernizr - 加载 polyfills / 使用自定义检测的正确方法

我想在网页上使用一些新的 HTML5 表单属性和输入类型有些浏览器已经支持它们有些浏览器不支持也永远不会支持这就是我想使用 Modernizr 的原因这就是我的麻烦开始的原因据我了解 Modernizr 本身并不是一个 poly
防止用户在下拉菜单中选择默认值

我试图阻止用户选择默认的下拉菜单选项有没有办法在下拉菜单选项中添加文本而不是值我的代码
PHP print_r() 中 _r 的含义是什么？

我见过这个答案 https stackoverflow com questions 13103410 what does r suffix mean就这样但我不确定它对于 PHP 是否相同如果是可重入的含义是什么 From PHP n
W3C 验证器：“握手警报：unrecognized_name”

我正在尝试验证我的网站W3C Nu Html 检查器 https validator w3 org nu doc https 3A 2F 2Fwww healthdrop in 2F但我遇到了以下错误不知道为什么 IO 错误握手警报 u
如何通过php获取网页的Open Graph协议？

PHP 有一个简单的命令来获取网页的元标记 get meta tags 但这仅适用于具有名称属性的元标记然而开放图谱协议如今变得越来越流行从网页获取 opg 值的最简单方法是什么例如我看到的基本方法是通过 cURL 获取页面并使用
如何延迟加载嵌入在 iframe 上的 YouTube 视频？

如何将延迟加载应用于iframe嵌入视频我尝试添加loading eager loading auto and loading lazyload 您可以使用srcdoc你里面的属性iframe标签来加载图像请参阅以下示例作为参考
如何删除文件

我们有一个脚本 scripts ourscript php和一个文件 media movie1 flv 当我们运行时我们如何删除这个文件ourscript php Using unlink http php net manual en f
WordPress 自定义帖子类型未显示在搜索结果中

我在 WordPress 中遇到自定义帖子类型测验和搜索的问题自定义帖子类型未显示在我的搜索结果页面中我的搜索结果中仅显示默认的帖子内容以下是我使用的代码函数 php函数create posttype register post
如何将送货地址复制到帐单地址

我想知道是否可以将送货地址复制到帐单地址当用户单击与送货地址相同的复选框时送货地址值将被复制到账单输入字段我完成了大部分部分但我不确定如何将选择菜单状态值复制到帐单地址我真的很感谢任何帮助 My code document r
我可以在 PHP 会话变量中安全地存储用户名和密码吗？

我想在 REST api 之上制作一个轻量级的 web 应用程序用户只需进行一次身份验证从那时起所有针对 web api 的请求都希望通过以某种方式保持用户名和密码有效来完成我已经做了一个工作原型我在哪里将用户名和密码存储在会话变量
如何从 Laravel 执行存储过程

我需要在表单提交数据后执行存储过程我让存储过程按照我想要的方式工作并且我的表单正常工作我只是不知道从 laravel 5 执行 sp 的语句它应该是这样的执行 my stored procedure 但我似乎在网上找不到类似的东西
如何使用 php 在 sql 查询中转义引号？

我有一个疑问 sql SELECT CustomerID FROM tblCustomer WHERE EmailAddress addslashes POST username AND Password addslashes POST p
Stream_context_set_params 不适用于 ssh2.sftp 包装器

我想使用类似的功能here http www php net manual en function stream notification callback php 请检查以下代码 function notify notification
PHP递归遍历对象树[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
需要有关 React Js 的帮助

我是 React Js 新手我的代码无法正常工作请看下面这是我的脚本文件Main jsx 该文件由 React 编译输出放置在 dist 文件夹下的 main js 文件中 var react require react react

随机推荐

MySQL TimeDiff 排除周末

我一直在 MySQL 表上使用 TimeDiff 来获取两个字段均为日期时间格式之间的差异这是我正在使用的查询它也将持续时间限制为仅今年 SELECT username CONCAT FLOOR SUM HOUR TIMEDIFF
如何在Struts 2中显示图像？

我需要检索数据库中的行并将图像保存在字节数组中如何使用Strut2显示图像我已经使用自定义结果显示了它我传递了 id 并在数据库中对其进行了操作搜索我的问题是如何多次调用它我有一个检索所有行的操作如何从列表操作中调用显示图像操
SQLAlchemy 中的 REGEXP_LIKE

任何人都知道我如何在 SQLAlchemy 中使用 REGEXP LIKE 的等效项例如我希望能够执行以下操作 sa Session query sa Table filter sa Table field like regex to
为什么在没有类型转换的情况下复合文字赋值不起作用

我有一个关于 C 语言文字的问题 int a a is an integer that is assigned an integer literal 414 a 414 float b b is a float that is assign
使用 broom 包整理地图时保留区域名称

我正在使用栅格包中的 getData 函数来检索阿根廷地图我想使用 ggplot2 绘制生成的地图因此我使用 broom 包中的 tidy 函数转换为数据框这工作正常但我不知道如何保留联邦地区的名称以便我可以在地图上使用它们这是
导入旧的 ES5 模块以在 ReactJS 组件中使用

我正在尝试在新的 ReactJS 应用程序中使用 ES5 模块并且我正在努力理解如何正确导入该模块以便可以找到并执行其中的主要函数我正在加载模块 import air datepicker 我知道我在这里做错了而且对于一个没有适当导
Python 并排带有颜色的 matplotlib 箱线图

我按照这个例子link关于如何创建带有颜色的箱线图我一直在尝试不同的方法来将这些箱线图分开在两个不同的位置而不是让它们重叠但无济于事如果我为它们指定不同的位置它们将保持在 bp2 位置如何将这两个箱线图并排放置 import m
如何在同一个消费者组中运行两个控制台消费者？

当我运行两个具有完全相同属性的 Kafka console consumers 实例使用默认的 config consumer properties 时我在两个实例上收到相同的消息 bin kafka console consumer
使用 VBA 将 url 发送到活动 IE 窗口

我正在使用 VBA 并在 Excel 中创建宏以向 IE 浏览器窗口发送信息或从 IE 浏览器窗口发送信息我一直在使用 AppActivate 来关注某个 IE 页面使用它的标题效果很好使用 SendKeys 将信息发送回浏览器并没
如何使用 jquery if else 语句切换类？

我想使用 jquery If Else 语句针对指定条件切换类我的 Html 带有默认 cssclass horizontal div class my item horizontal div 现在我怎样才能在之间洗牌我的CSS类hori
Phonegap：安装适用于 iOS 的 BarcodeScanner 时出错

当我尝试安装 iOS 版 BarcodeScanner 插件时 plugman install platform ios project Users amarruffo Documents Projects phonegap barcode
如何在ggplot中标记堆叠直方图

我正在尝试将相应的标签添加到直方图中条形图中的颜色这是一个可重现的代码 ggplot aes displ data mpg geom histogram aes fill class binwidth 1 col black 此代码给出了
无法使用“-”破折号访问 JSON 属性 [重复]

这个问题在这里已经有答案了当字符串具有破折号字符时我无法从 json 对象检索值 profile id 1234 user id 6789 如果我尝试引用解析的jsonObj profile id它返回ReferenceError id
ASP.Net Core 3 远程证书在 MacO 上无效

当我尝试使用 Identityserver4 调用 API 方法时我之前在 Windows 上尝试过但它仅在 Mac OS 中工作正常我遇到了这个问题我不知道发生了什么以及如何解决它我可以访问 https localhost 60
C 中布尔表达式的返回值

由于不值得一提的原因我想知道布尔表达式是否有标准定义值例如 int foo return bar gt 5 背景是我担心我们的团队将 TRUE 定义为与 1 不同的东西并且我担心有人可能会这样做 if foo TRUE do stuf
ggplot2根据数据值填充颜色

我希望能够根据数据框中存储的值设置 ggplot 填充颜色下面的代码几乎是我想要做的除了我不只是使用 fill MyColor 我希望代码实际使用 MyColor 字段中的 RRGGBB 十六进制值 df data frame An
模拟器错误 UnparseableJsonResponse（“找不到字段。”）

我已在 DialogFlow 控制台中使用 webhook 成功测试了应用程序的前几个意图但在模拟器中进行测试时出现以下错误 UnparseableJsonResponse API 版本 2 无法解析 JSON 响应带有 INVALID
使用 CMake 在同一解决方案中创建 C# 和 C++/CLR 项目（CMake 面向 Visual Studio）

我想使用 CMake 在 MSVC 中创建一个解决方案该解决方案具有两个项目在 CMake 词汇中一个 C 执行程序和一个 C CLR 库我怎样才能做到这一点我发现的所有示例都是关于 CMake 中的一种类型的项目全部为 C 或
检查哪些程序正在播放音频？

我正在制作一个程序我想找到正在播放音频的程序并将其静音这样您听到的都是我的这是程序的一个选项没有恶意我查了一下似乎找不到一种方法来检查哪些程序正在播放音频就像 Windows 一样我没有任何尝试此操作的代码示例因为 id
file_get_contents() 给我 403 Forbidden

我有一个合作伙伴创建了一些内容供我抓取我可以使用浏览器访问该页面但是当尝试使用file get contents 我得到一个403 forbidden 我尝试过使用stream context create 但这没有帮助可能是因为我不

file_get_contents() 给我 403 Forbidden

file_get_contents() 给我 403 Forbidden 的相关文章

随机推荐

热门标签