Python 请求：requests.exceptions.TooManyRedirects：超过 30 个重定向

2024-04-15

我试图使用 python-requests 库抓取此页面

import requests
from lxml import etree,html

url = 'http://www.amazon.in/b/ref=sa_menu_mobile_elec_all?ie=UTF8&node=976419031'
r = requests.get(url)
tree = etree.HTML(r.text)
print tree

但我得到了上述错误。（重定向过多）我尝试使用allow_redirects参数但同样的错误

r = requests.get(url, allow_redirects=True)

我什至尝试发送标头和数据以及网址，但我不确定这是否是正确的方法。

headers = {'content-type': 'text/html'}
payload = {'ie':'UTF8','node':'976419031'}
r = requests.post(url,data=payload,headers=headers,allow_redirects=True)

如何解决此错误。出于好奇，我什至尝试过 beautiful-soup4 ，但出现了不同但相同类型的错误

page = BeautifulSoup(urllib2.urlopen(url))

urllib2.HTTPError: HTTP Error 301: The HTTP server returned a redirect error that would lead to an infinite loop.
The last 30x error message was:
Moved Permanently

亚马逊正在将您的请求重定向至http://www.amazon.in/b?ie=UTF8&node=976419031，这又重定向到http://www.amazon.in/electronics/b?ie=UTF8&node=976419031，之后就进入了循环：

>>> loc = url
>>> seen = set()
>>> while True:
...     r = requests.get(loc, allow_redirects=False)
...     loc = r.headers['location']
...     if loc in seen: break
...     seen.add(loc)
...     print loc
... 
http://www.amazon.in/b?ie=UTF8&node=976419031
http://www.amazon.in/electronics/b?ie=UTF8&node=976419031
>>> loc
http://www.amazon.in/b?ie=UTF8&node=976419031

因此，您的原始 URL AN 重定向到新的 URL B，新的 URL B 重定向到 C，新的 URL 重定向到 B，等等。

显然，亚马逊是根据 User-Agent 标头来做到这一点的，此时它会设置一个 cookie，后续请求应发送回该 cookie。以下作品：

>>> s = requests.Session()
>>> s.headers['User-Agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.131 Safari/537.36'
>>> r = s.get(url)
>>> r
<Response [200]>

这创建了一个会话（为了便于重用和 cookie 持久性）和 Chrome 用户代理字符串的副本。请求成功（返回200响应）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

beautifulsoup

pythonrequests

Python 请求：requests.exceptions.TooManyRedirects：超过 30 个重定向的相关文章

Python正则表达式替换除特定单词之外的所有内容

我正在尝试执行以下操作用正则表达式 import re x re compile going you words to replace s I am going home now thank you string to modify pri
Spyder 和 Jupyter 有什么区别？

我正在学习Python用于数据科学但我的问题是我仍然不明白Spyder和Jupyter之间的区别我希望你们能帮助我理解其中的区别我将不胜感激以下只是这两个工具的基本摘要 Jupyter 是一个非常流行的用于数据分析的应用程序它是一
在 Python 中比较浮点数是否几乎相等的最佳方法是什么？

众所周知由于舍入和精度问题比较浮点数是否相等有点繁琐例如比较浮点数 2012 年版 https randomascii wordpress com 2012 02 25 comparing floating point number
扭曲多种协议

我希望为我正在从事的项目学习扭曲该项目需要服务器响应 HTTP 请求以及通过 TCP 连接的其他协议 Twisted能够同时处理多种协议吗我想使用 Twisted Web 来帮助处理 HTTP 但同时需要响应其他端口上的 TCP 连接
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
Python 正则表达式从文本中提取域

我有以下正则表达式 r a zA Z0 9 a zA Z0 9 61 a zA Z0 9 a zA Z 2 6 当我将其应用于文本字符串时比方说这是 www website1 com 这是 website2 com 我得到 www we
打开文件路径在 python 中不起作用[重复]

这个问题在这里已经有答案了我正在编写一个数据库程序 personica 是我的测试主题我通常在文件路径的位置有一个变量但出于测试和演示的目的我只有一个字符串在我的计算机上的这个确切位置有一个文本文件顺便说一句因为我很偏执所以
在Python中整齐地绘制PMF

有没有一个库可以帮助我在 python 中整齐地绘制样本的概率质量函数如下所示通过matplotlib pyplot的stem模块 matplotlib pyplot stem args kwargs from matplotlib p
无法使用 wxPython 打开在 folium 中生成的本地 HTML 文件

我目前正在尝试将 GPS 坐标绘制为地图上的标记并在 wxPython 中显示结果我使用 folium 绘制坐标标记并生成 HTML 文件 import folium fmap folium Map 43 5321 172 6362 z
NumPy 根据另一个数组中的值对第三个数组中的每个匹配元素求和一个数组

我有两个 numpy 数组一个包含值另一个包含每个值类别 values np array 1 2 3 4 5 6 7 8 9 10 valcats np array 101 301 201 201 102 302 302 202 102
__author__ 的起源是什么？

使用私有元数据变量的约定在哪里 author 一个模块内部从何而来 This http mail python org pipermail python dev 2001 March 013328 htmlPython 邮件列表线程似乎暗示
在解析器/子解析器的开头使用 argparse.REMAINDER

我想实现一个 arg 解析器它允许我将单元测试作为子命令之一运行盲目地将参数传递给 unittest main 例如 foo py unittest args to pass to unittest main 以及其他子命令 foo p
Django - 渲染到字符串无法加载 CSS

我正在尝试使用 Django 1 8 render to string 通过管理命令将 html 转换为 pdf 而不是使用 View request 以下代码可以将模板转换为 pdf 但它无法将 CSS 加载到模板中 def html t
如何动态选择要在flask中使用的模板目录？

默认情况下 Flask 使用存储在 template 目录中的模板文件 flaskapp application py templates hello html 有没有办法根据登录的用户动态选择模板目录这就是我想要的目录结构 flaska
Hoare Partitioning算法讲解

根据许多网站给出的伪代码我写了这个Hoare分区算法它采用一个数组根据给定的主元来分区子数组的开始和结束索引它工作得很好但是有人可以解释一下逻辑它是如何做到这一点的吗这是代码 def hoare arr start end p
Pandas 数据框可对多列和要列出的值进行字典

我有一个数据框 id key a1 1 a2 1 a3 1 a4 2 a5 2 a6 3 我想创建一本字典key作为机器号并且id列作为列表 like 1 a1 a2 a3 2 a4 a5 3 a6 我可以先使用 groupby 然后再使
Paramiko ValueError“p 的长度必须恰好为 1024、2048 或 3072 位”

我正在尝试使用 Python 脚本连接 SFTP 由于 p 错误我无法连接 import paramiko client paramiko SSHClient client load system host keys client con
如何通过解析导入来组合并获取单个 Python 文件

我正在尝试获取单个 Python 文件作为输出我有一个 Python 脚本其中有多个此类导入 from that import sub 导入来自所有本地模块而不是来自系统或 Python 库有什么方法可以解决这些问题并获得一个完整的
如何使用多阶段构建减小 python (docker) 图像大小？

我正在寻找一种使用 python 和 Dockerfile 创建多阶段构建的方法例如使用以下图像第一张图片安装所有编译时要求并安装所有需要的 python 模块第二张图片将所有已编译构建的包从第一个映像复制到第二个映像而不
我可以以某种方式“编译”一个Python脚本以在没有安装Python的PC上运行吗？

所以我有一个Python脚本 myscript py 我是这样执行的 python D myscript py 但是我必须安装 Python 并将其包含在PATH使其工作的环境变量是否有可能以某种方式将 Python 可执行文件与 Py

随机推荐

Android 中的屏幕截图

我想开发一个应用程序来截取 android 屏幕的屏幕截图有人知道怎么做吗这类似于 koushik duttas 屏幕截图但是没有使用 root 并且有人有 koushik dutta 屏幕截图应用程序正在运行不适合我请让我知道
Kubernetes Dashboard 在整个网站上都是“被禁止的”

我在 Kubernetes 的仪表板网站上到处都看到被禁止见图重现通过站点而不是从 shell 创建 Google Kubernetes 集群选择 Kubernetes 版本 1 8 6 通过连接按钮打开外壳 gcloud con
Autobahn websockets Android 演示崩溃

我是 websockets 的新手我一直在使用 Autobahn websocket 来制作一个更大的项目它在 python 和 js 版本中工作得很好但我在 Android API 上遇到了麻烦我正在遵循中的教程http www
取消任务关闭窗口。如何检测任务是否同步返回？

我遵循一种相当常见的模式使用异步对话框方法确认取消主窗口关闭但是在我调用来呈现对话框的异步任务中在某些情况下我会立即返回布尔值而不是等待对话框任务方法的返回在这些情况下会抛出异常 System InvalidOperation
WPF/XAML：如何使 TextBlock 中的所有文本大写？

我希望 TextBlock 中的所有字符都以大写形式显示
无法使用 iframe 标签在 WebView 中播放视频？

我正在使用以下数据来显示WebView 这些是 HTML 标签以及指的是视频的 iframe 现在的问题是当我点击它时它显示播放按钮但无法播放视频我可以在里面播放这个视频吗WebView or not lt p gt lt p g
反汇编中演示 volatile 的示例 C 代码？

演示反汇编中易失性和非易失性之间差异的简短说明性 C 程序是什么 ie int main volatile int x vs int main int x 我们可以用什么来代替两者这样生成的代码就不同了例如 x 0 If x is no
从原始 r 和 s 创建 DER 格式的 ECDSA 签名

我有一个原始 ECDSA 签名 R 和 S 值我需要 DER 编码版本的签名有没有一种直接的方法可以使用 c 接口在 openssl 中执行此操作我目前的尝试是使用i2d ECDSA SIG const ECDSA SIG sig u
单选按钮选中更改事件触发两次

请阅读我的问题它不是重复的问题我在 Windows 窗体上有三个单选按钮所有这些按钮都具有关联的常见 CheckedChanged 事件当我单击任何这些单选按钮时它会触发 CheckedChanged 事件两次这是我的代码 pr
什么可能导致 ASP.NET 应用程序忘记用户？

我有一个 ASP NET 应用程序它似乎在一段时间后忘记了用户已登录我正在使用会员资格提供商当选择记住登录时它会在会话期间记住它我什至可以关闭浏览器重新启动并返回它仍然会登录但过了一段时间它就会忘记而且似乎在任何旧时间
在 ASP.NET 3.5 中创建 RSS 源

如何使用 C 在 ASP NET 3 5 中创建 RSS 提要哪些框架部分可以帮助 NET 开发人员更轻松地发布 RSS 或 Atom 提要 NET 4 中是否有任何额外功能可以使此任务比 3 5 中更容易 3 5 中有一个新的命名空间
如何限制拖动元素在interact.js中重叠

容器中的拖动元素不应该重叠我们如何限制请帮忙交互API链接 http interactjs io 抱歉没有尽早回答这个问题我相信你必须手动检查元素的顶部底部左侧和右侧边缘的位置所以这就是我所做的 Call this func
matlab 数组中的 DICOM 维度（所有帧都以数组的最后一个维度结束）

在我的 GUI 之一中我加载 DICOM 图像有时它们只是一个体积和另一个维度当我将它们加载到 Matlab 中时一切都会到达我想要的位置 handles inf dicominfo filepath filename handle
对链接列表进行排序

我用 C 编写了一个基本的链表类它有一个 Node 对象它显然代表列表中的每个节点代码中没有使用IEnumerable 但是我可以实现排序功能吗我使用的语言是C C 中有这样的例子吗我正在从这个工作sample http ww
Python，在输出中将所有浮点数打印到小数点后两位

我需要输出 4 个不同的浮点数到小数点后两位这就是我所拥有的 print 2f var1 kg 2f var2 lb 2f var3 gal 2f var4 l 这是非常不干净的而且看起来很糟糕有没有办法让输出 2f 中出现任何浮动
如何在 Swift 中创建一个空数组？

我对如何在 Swift 中创建空数组感到非常困惑您能否向我展示创建带有一些细节的空数组的不同方法干得好 var yourArray String 上面的方法也适用于其他类型而不仅仅是字符串这只是一个例子为其添加价值我想您最终会想
app.dock.hide(); 的等效项是什么？

我目前正在开发电子托盘应用程序对于 Mac Electron 框架具有将应用程序隐藏在 Dock 中的功能 app dock hide 我尝试在 Windows 计算机上运行此程序并收到错误 TypeError Cannot read p
“内部联系”是什么意思？

标准中写道当名称具有内部链接时它所表示的实体可以是由同一翻译单元中其他范围的名称引用 and 具有命名空间范围 3 3 6 的名称具有内部链接如果它是变量函数或函数模板的名称显式声明为静态所以考虑下面的代码 include
s3 存储桶中的 utf-8 文件名

是否可以使用 utf 8 编码名称如 jpg 向 s3 添加密钥使用 boto 上传时出现以下错误
Python 请求：requests.exceptions.TooManyRedirects：超过 30 个重定向

我试图使用 python requests 库抓取此页面 import requests from lxml import etree html url http www amazon in b ref sa menu mobile ele

Python 请求：requests.exceptions.TooManyRedirects：超过 30 个重定向

Python 请求：requests.exceptions.TooManyRedirects：超过 30 个重定向 的相关文章

随机推荐

热门标签

Python 请求：requests.exceptions.TooManyRedirects：超过 30 个重定向的相关文章