urllib2 HTTP 错误 429

2023-11-25

所以我有一个 sub-reddits 列表，我使用 urllib 来打开它们。当我仔细检查它们时，最终 urllib 失败了：

urllib2.HTTPError: HTTP Error 429: Unknown

经过一些研究，我发现 reddit 通过 IP 限制对其服务器的请求量：

每两秒发出的请求不得超过一个。对于突发请求有一定的限度，但要保持理智。一般来说，一分钟内的请求数不要超过 30 个。

所以我想我会用time.sleep()将我的请求限制为每 10 秒一页。这最终也以失败告终。

上面的引用摘自红迪API页。我没有使用 reddit API。此时我在想两件事。该限制要么仅适用于 reddit API，要么 urllib 也有限制。

有谁知道这是这两件事中的哪一件吗？或者我该如何解决这个问题？

From https://github.com/reddit/reddit/wiki/API:

许多默认的用户代理（例如“Python/urllib”或“Java”）受到极大限制，无法鼓励独特且描述性的用户代理字符串。

这也适用于常规请求。发出请求时，您需要提供自己的用户代理标头。

#TODO: change user agent string
hdr = { 'User-Agent' : 'super happy flair bot by /u/spladug' }
req = urllib2.Request(url, headers=hdr)
html = urllib2.urlopen(req).read()

但是，这将为每个请求创建一个新连接。我建议使用另一个能够重用连接的库，httplib or Request，例如。它将减轻服务器的压力并加快请求速度：

import httplib
import time

lst = """
science
scifi
"""

hdr= { 'User-Agent' : 'super happy flair bot by /u/spladug' }
conn = httplib.HTTPConnection('www.reddit.com')
for name in lst.split():
    conn.request('GET', '/r/'+name, headers=hdr)
    print conn.getresponse().read()
    time.sleep(2)
conn.close()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

urllib2

httpstatuscode429

urllib2 HTTP 错误 429 的相关文章

在 while 循环中更改 tkinter 画布中的图像

我的完整代码是here https gist github com ItsBerry de245ba70376cb07f4dbe2d25c223f5f 我正在尝试使用 tkinter 的画布创建一个小游戏让人们练习学习高音谱号上的音符最
如何向数据添加填充以使其可以接受 pycrypto 库中的 AES256 加密算法

有人可以告诉我如何向数据添加填充使其可以接受 pycrypto 库 Python 中的 AES256 加密算法提前非常感谢看着文档 http www dlitz net software pycrypto doc 看来要由图书馆用户自
使用 matplotlib 在图像数据之上对线网格进行像素精确定位

我试图在 python 库 matplotlib 显示的图像网格顶部精确地覆盖 1 像素宽线的网格不幸的是我似乎无法对结果进行足够精细的控制以实现线网格与数据网格的正确对齐如下面的代码所示结果似乎总是很接近但并不完全正确我尝试
Python：用中值替换异常值

我有一个 python 数据框其中有一些异常值如果这些值不存在的话我想用数据的中值替换它们 id Age 10236 766105 11993 288 9337 205 38189 88 35555 82 39443 75 10762
在Python中用空格分割字符串——保留带引号的子字符串

我有一个像这样的字符串 this is a test 我正在尝试用 Python 编写一些内容以将其按空格分开同时忽略引号内的空格我正在寻找的结果是 this is a test 附言我知道您会问如果引号内有引号会发生什么嗯在
BeautifulSoup 不适用于某些网站

我有这个脚本 import urrlib2 from bs4 import BeautifulSoup url http www shoptop ru page urllib2 urlopen url read soup Beautiful
numpy.linalg.inv() 是否给出了正确的矩阵逆？编辑：为什么 inv() 给出数值错误？

我有一个矩阵形状 4000 4000 我想取逆矩阵我对逆矩阵的直觉因如此大的矩阵而崩溃起始矩阵的值大小为e 10 具有以下值 print matrix给出一个输出 2 19885119e 10 2 16462810e 10 2 1306
如何在python包中包含.pyx文件

我在我的包中使用了 cythonpyirt https github com 17zuoye pyirt 但是当我将其发布到 pypi 时 pyx 文件不包含在 tar gz 中我认为这一定与安装文件有关但是我找不到解决这个问题的方法
如何在 Google App Engine 中为模型定义唯一属性？

我需要一些独特的属性我怎样才能实现这个目标有没有类似的东西unique True 我正在使用适用于 Python 的 Google App Engine Google 提供了执行此操作的函数 http code google com a
seaborn 未在定义的子图中绘制

我正在尝试用这段代码并排绘制两个图表 fig ax1 ax2 plt subplots 1 2 sns displot x X train Age hue y train ax ax1 sns displot x X train Fare
Python：选择多个已安装模块版本之一

在我的系统上我多次安装了多个模块举个例子 numpy 1 6 1安装在标准路径中 usr lib python2 7 dist packages 我有一个更新版本numpy 1 8 0安装于 local python lib pytho
Django外键：获取相关模型？

是否可以通过外键字段本身获取外键的相关模型例如如果我有 3 个模型 class ModelA models Model field1 models CharField max length 10 class ModelB models
您能否从函数、args 和 kwargs 确定变量将如何分配？

我有一些样板逻辑我想包装几个具有相同可选关键字的函数现在看起来像下面的代码但是这仅处理 opt key 作为关键字传递的情况而不是按位置传递解决这个问题的一种方法是了解如何解决参数分配是否有一些元函数接受函数 args 和 k
Django：上传前调整图像大小

我想调整图像大小 Pillow 在上传之前我在下面编写了代码但不起作用并得到错误 myapp list 处的属性错误坚定的请求方式 POST 请求网址 http 127 0 0 1 8000 myapp list http 127
VS Code Pylance 不突出显示变量和模块

我正在使用带有 Python 和 Pylance 扩展的 VS Code 我遇到的问题是 Pylance 扩展没有对模块和数据框等内容进行语法突出显示我希望顶部的模块为绿色 df 变量为蓝色我正在使用默认的深色颜色主题这是我的 VS
使用 pyinstaller 制作的可执行文件出现运行时错误

所以我使用 Pygame 制作了一个游戏现在我想用它制作一个可执行文件首选独立可执行文件所以我用它来制作可执行文件 pyinstaller onefile main py 编译顺利但运行时出现错误这是错误 Traceback mo
如何使用 Python 3 在 OpenCV 3 上正确加载 cv2.KeyPoint 和描述符？

有一天我不得不恢复一个使用 OpenCV 3 和 Python 2 7 的旧项目在此代码中要加载 cv2 KeyPoint 我执行以下操作 import numpy as np import cPickle import cv2 ke
使用 PyCharm 分析 Django

即使在开发环境中我的应用程序也相当慢所以我想找出是什么导致它变慢以便我可以尝试修复它我了解调试工具栏根据它的报告数据库查询和下载的源都不是问题所以它一定是业务逻辑但是我无法使用 Django 服务器运行 PyCharm 分
如果我更改当前工作目录，为什么 __file__ 会变成无效路径？

执行中test py from tmp import os print os path abspath file os chdir var print os path abspath file output tmp test py var
从 s3 获取 ogg 轨道的长度而不下载整个文件

如何在不下载整个文件的情况下获取 ogg 文件的播放长度我知道这是可能的因为 HTML5 标签和 VLC 都可以在加载 URL 后立即显示整个播放长度而无需下载整个文件有标题或我可以阅读的内容吗也许甚至是比特率我可以将其除以文件

随机推荐

Android Fragment 导航和 Backstack

我有一个标题栏有点像菜单和 4 个片段 MAIN A B C 其中 MAIN 应该是用于 backstack 的 main root 片段我遇到的问题是当用户通过菜单进入例如 MAIN gt A gt B gt C 时如果我只是使用
Android Studio 无法找到有效的 Jvm（与 MAC OS 相关）

我无法在 Mac OS 10 10 1 Yosemite 上启动 Android Studio 进行 Android 开发打开应用程序包安卓工作室在 Finder 中然后编辑信息表文件更改关键 JVM 版本将 1 6 改为 1 6
CMake：如何为头文件设置COMPILE_FLAGS？

我已经成功使用CMake构建了共享库但大小不太好我已经尝试过几个编译标志来减少大小等 set source files properties TARGET SOURCE FILES PROPERTIES COMPILE FLAGS fe
当 import_array 不在同一翻译单元中时出现段错误

我在正确初始化 NumPy C API 时遇到问题我想我已经将问题与调用隔离了import array来自不同的翻译单位但我不知道为什么这很重要最小工作示例 header1 hpp ifndef HEADER1 HPP define
将 WAR 文件部署到 Jboss EAP 6.0（在 JBOSS AS 7.1 下工作）时出错

我们正在开发使用 Jboss Spring 和 Hibernate 构建的新系统目前我们正在从 AS 7 1 迁移到 EAP 6 0 由于我们未知的原因部署到 EAP 6 0 服务器时部署失败但在 AS 7 1 下工作得很好在我们的
我可以使用 Google Visualization API 在应用脚本中查询电子表格吗？

我有一个包含大约 3000 行数据大约 30 列的 Google 电子表格数据以标准方式布局包含列标题和每个数据项一行这些数据代表各种学术课程中使用的案例研究和文章并且数据集始终在增长我需要根据指定的参数搜索查询数据例如
Meteor template.find 未定义

我正在尝试使用template find让我的生活更轻松但在 javascript 控制台中我得到 undefined is not a function 这就是我所拥有的它被绊倒了template find Template supe
我们可以在 perl 脚本中获取 shell 脚本吗

我们可以在 perl 脚本中获取 shell 脚本吗例子方案一 cat test1 sh bin ksh DATE bin date 方案2 cat test2 sh bin ksh test1 sh echo DATE 方案3 cat
为什么 printf 对浮点数进行四舍五入？

我正在尝试使用打印一些浮点数printf 例如 int main printf 1f 76 75 return 0 Output 76 8 我对结果有一些疑问首先为什么没有打印出来76 7 其次这个数字是如何四舍五入的 C99 7 1
在 apply 内使用 ifelse

我试图在数据集中创建一个新列根据预先存在的列的输入为每一行提供一个输出在此输出列中我希望 NA if给定行中的任何输入值都是 0 否则如果没有一个输入为 0 我希望该行的输出是输入的唯一值的数量我认为解决方案将使用ifelse嵌
更改 JAX-WS 服务 URL

创建 JAX WS Web 服务时是否可以更改 Web 服务 URL 自动 URL 为在 Glassfish 3 上 http
Xcode Instruments 错误：“分配跟踪库未及时加载”

安装 Xcode5 包时出现问题我正在使用 Mavericks 不确定这是否相关 Cannot profile allocations in simulator Instruments would load and start app i
如何在JavaScript中将文件转换为base64？

UPDTypeScript 版本也可以在答案中找到现在我通过这一行获取 File 对象 file document querySelector files gt input type file files 0 我需要通过 json 以 B
Chrome 扩展中内容脚本的未定义响应

我无法从我的内容脚本获得响应以显示在我的 popup html 中当此代码运行并单击查找按钮时 Hello from response 打印但变量响应被打印为未定义最终目标是将当前选项卡的 DOM 放入我的脚本文件中以便我可以解析它
Go——声明但未使用错误，当我认为我已经对变量这样做了

这段代码有什么问题 package main import fmt fibonacci is a function that returns a function that returns an int func fibonacci fun
我应该如何处理 PostgreSQL 中的“从 y 中排名 x”数据？

我有一个表格我希望能够呈现 Y 中排名 X 的数据特别是我希望能够以相对有效的方式呈现单个行的数据即无需选择表中的每一行排名本身非常简单它是对表中单个列的直接 ORDER BY Postgres 似乎在这方面提出了一些独特的挑战
从 Fragment 访问 Activity

我正在尝试更改片段中的活动标题在本例中它是一个android support v4 app Fragment 为此我将活动保存在片段的属性中onAttach 在片段上调用根据文档 onAttach 应该在之前调用onCreateVi
将星期几存储在数据库中

我必须为学校做一个小项目在数据库表中存储一周中的几天的最佳可能性是什么例如一周中的哪几天进行数据备份我应该使用这样的列 backupDays varchar 50 1 5 gt gt monday friday 2 3 4 gt g
连接由对等方重置：套接字写入错误 - Coldfusion 10 上的 cfcontent

我们最近从 Coldfusion 9 升级到 CF10 我现在在使用 cfcontent 提供文档 pdf doc 等的页面上收到偶发错误我使用 cfcontent 来控制对文件的访问如下所示有些仅供内部使用使用 CF9 均为标准
urllib2 HTTP 错误 429

所以我有一个 sub reddits 列表我使用 urllib 来打开它们当我仔细检查它们时最终 urllib 失败了 urllib2 HTTPError HTTP Error 429 Unknown 经过一些研究我发现 reddi

urllib2 HTTP 错误 429

urllib2 HTTP 错误 429 的相关文章

随机推荐

热门标签