从简单的 get 返回 403 Forbidden 但在浏览器中加载正常

2023-12-15

我试图从页面获取一些数据，但它返回错误 [403 禁忌].

我以为是用户代理，但我尝试了几个用户代理，它仍然返回错误。

我也尝试使用图书馆假用户代理但我没有成功。

with requests.Session() as c:
        url = '...'
        #headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2224.3 Safari/537.36'}
        ua = UserAgent()
        header = {'User-Agent':str(ua.chrome)}
        page = c.get(url, headers=header)
        print page.content

当我手动访问该页面时，一切正常。

我正在使用 python 2.7.14 和请求库，任何想法？

该网站可能会使用请求中的任何内容来触发拒绝。

So, copy all headers from the request that your browser makes. Then delete them one by one¹ to find out which are essential.

As per Python 请求。 403 禁忌，要将自定义标头添加到请求中，请执行以下操作：

result = requests.get(url, headers={'header':'value', <etc>})

¹_{A faster way would be to delete half of them each time instead but that's more complicated since there are probably multiple essential headers}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

webscraping

pythonrequests

从简单的 get 返回 403 Forbidden 但在浏览器中加载正常的相关文章

如何在Python中循环并存储自变量中的值

我对 python 很陌生所以这听起来可能很愚蠢我进行了搜索但没有找到解决方案我在 python 中有一个名为 ExcRng 的函数我可以对该函数执行什么样的 for 循环以便将值存储在独立变量中我不想将它们存储在列表中而是
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Python - 用逗号分割，跳过括号内的内容

我需要用逗号分隔字符串但我对这种情况有一个问题 TEXT EXAMPLE THIS IS A EXAMPLE BUT NOT WORKS FOR ME SECOND THIRD 我想拆分并得到 var 0 TEXT EXAMPLE THI
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
如何从 Dockerfile 安装 Python 3.7 和 Pip

我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本这样就可以使用python代替pytho
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
如何使用 python urllib 在 HTTP/1.1 中保持活力

现在我正在这样做 Python3 urllib url someurl headers HOST somehost Connection keep alive Accept Encoding gzip deflate opener urll
“char”/“character”类型的类型提示

char 或 character 没有内置的原始类型因此显然必须使用长度为 1 的字符串但是为了暗示这一点并暗示它应该被视为一个字符如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
Python - 如何查询定义方法的类？

我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide

随机推荐

使用变音符号写入 CSV 文件会导致“UnicodeEncodeError：‘ascii’编解码器无法对字符进行编码”

我正在尝试用双点元音变音书写字符例如和我可以将其写入文件data encode utf 8 但结果b xc3 xa4 xc3 xa4 xc3 x96 不太好 UTF 8 作为文字字符我想要得到写入存储到文件中如何在 Pyth
Rails：使用可以看到所有用户的设备添加管理员角色

我需要使用 devise 为我的应用程序创建一个管理员角色我已经使用 devise 创建了基本身份验证我的应用程序中有一个设计用户模型但现在我需要一个可以显示编辑和销毁所有用户的管理员我尝试按照教程进行操作但没有一个有帮助我使用
T_INLINE_HTML？这有什么问题吗？

table class t errors tr td b IP b b Command b b Executed b td tr table
Firefox 附加组件 ID 约定

我正在使用 WebExtension API 编写 Firefox 附加组件一些API 例如browser storage sync 需要一个附加 ID在附加组件中明确声明manifest json file The ID 的文档 sta
FB.getLoginStatus 始终返回 status='unknown'

如果我登录到 facebook com 我希望调用 FB getLoginStatus 将返回 status not authorized 相反即使我为 force 参数传递 true 它也会返回 status unknown 如果我调用
Delphi 类似“闹钟”的应用程序

我需要制作一个简单的闹钟应用程序它不是播放声音而是将文件上传到 ftp 弄清楚了后者事实证明计时器是无效的当涉及到执行一个线程时这是我到目前为止得到的 var ttime tDateTime timerstr string time
sqlite 数据库在插入时被锁定

有一个简单的代码 var insert INSERT INTO files Name FullName MD5 VALUES Name FullName MD5 using var con db OpenConnection using v
Hibernate 4.3.6 QuerySyntaxException：连接所需的路径

HQL 连接查询有问题谁能告诉我下面的连接 HQL 查询有什么问题吗我使用 Hibernate 4 3 6 JDK 7 和 Groovy 2 2 def query select lip referenceId from Parcel
在 HQL 中执行日期/时间数学？

我正在寻找如何在 HQL 查询中执行日期时间数学具体来说如何从结果中添加或减去 x 时间量current timestamp 功能或者我是否必须为此使用 SQL 并希望正在运行的任何数据库都支持它 HQL查询示例 FROM Rand
如何在MVC4的编辑模式下将值传递给下拉字段？

您好我的视图中有三个字段这三个字段已下拉我想在单击编辑按钮时将值传递给这些字段这是需要传递到下拉字段的值下面提到我的观点在我看来我有很多下拉菜单但一旦我知道如何将值传递给一个下拉菜单就意味着我将为另一个下拉菜单执行此操作
python 的 dict .get() 方法如何检查默认参数？

我遇到了一种奇怪的 Python 行为很难向自己解释当我传递一个默认值以从字典中获取键时看起来它首先尝试找到该默认值然后查看键是否存在如果字典中存在该键则会抛出错误为什么会发生这种情况 from collections imp
Gradle：Uber Jar 创建失败并显示“无法扩展 ZIP”

我正在尝试使用 Gradle 创建一个 Fat Uber jar 不幸的是我不断遇到以下错误 gt Task fatJar FAILED FAILURE Build failed with an exception What went w
PHP 和 Codeigniter。如何返回数组对象而不是普通数组？

在 Codeigniter 中我创建一个数组并将其返回给用户我正在创建这样的数组结果是数据库查询的返回形式 array email gt result 现在它输出 email id 629 desc 0000 value 1 0000
可编辑复杂SQL查询的QTableView

如何制作可编辑的 QTableView 显示复杂 SQLite 查询中的数据我需要用多个 SQLite 表中的数据填充 QTableView 这需要由用户可编辑由于查询有点复杂包括 JOIN 和 CASE WHEN 等我通过 QSq
vbs 脚本中的 If-Else If 语句

我需要知道如何制作 if else if 语句以便根据用户按下的按钮答案显示不同的消息您可以使用If ElseIf and End If指令 If i 10 Then response write Just started Else
如何在 jQuery 中获取第一个元素而不是使用 [0]？

我是 jQuery 的新手如果这是一个愚蠢的问题我深表歉意当我使用它使用 id 查找元素时我知道总是有一个匹配项为了访问它我将使用索引 0 有更好的方法吗例如 var gridHeader grid GridHeader 0
将包含字典的单元格分解为 Pandas 中的多行[重复]

这个问题在这里已经有答案了如何将包含字典的单元格中的内容分解为 Pandas 中的多行 ID CODES A 1407273790 5 1801032636 20 1174813554 1 1215470448 2 1053754655
加载多个 javascript 文件 - jquery

我使用下面的代码动态加载js脚本 getScript site js test js done function script textStatus console log test js textStatus 如果我想在同一段代码中加载多
简单的 D3 演示不适用于更改后的结构

我正在关注official教程由于结构相当简陋我决定做一个更干净的结构
从简单的 get 返回 403 Forbidden 但在浏览器中加载正常

我试图从页面获取一些数据但它返回错误 403 禁忌我以为是用户代理但我尝试了几个用户代理它仍然返回错误我也尝试使用图书馆假用户代理但我没有成功 with requests Session as c url headers User

从简单的 get 返回 403 Forbidden 但在浏览器中加载正常

从简单的 get 返回 403 Forbidden 但在浏览器中加载正常 的相关文章

随机推荐

热门标签

从简单的 get 返回 403 Forbidden 但在浏览器中加载正常的相关文章