使用 Tweepy 避免 Twitter API 限制

2024-02-13

我在 Stack Exchange 上的一些问题中看到，限制可能是每 15 分钟请求数量的函数，并且还取决于算法的复杂性，只不过这不是一个复杂的算法。

所以我使用这段代码：

import tweepy
import sqlite3
import time

db = sqlite3.connect('data/MyDB.db')

# Get a cursor object
cursor = db.cursor()
cursor.execute('''CREATE TABLE IF NOT EXISTS MyTable(id INTEGER PRIMARY KEY, name TEXT, geo TEXT, image TEXT, source TEXT, timestamp TEXT, text TEXT, rt INTEGER)''')
db.commit()

consumer_key = ""
consumer_secret = ""
key = ""
secret = ""

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(key, secret)

api = tweepy.API(auth)

search = "#MyHashtag"

for tweet in tweepy.Cursor(api.search,
                           q=search,
                           include_entities=True).items():
    while True:
        try:
            cursor.execute('''INSERT INTO MyTable(name, geo, image, source, timestamp, text, rt) VALUES(?,?,?,?,?,?,?)''',(tweet.user.screen_name, str(tweet.geo), tweet.user.profile_image_url, tweet.source, tweet.created_at, tweet.text, tweet.retweet_count))
        except tweepy.TweepError:
                time.sleep(60 * 15)
                continue
        break
db.commit()
db.close()

我总是收到 Twitter 限制错误：

Traceback (most recent call last):
  File "stream.py", line 25, in <module>
    include_entities=True).items():
  File "/usr/local/lib/python2.7/dist-packages/tweepy/cursor.py", line 153, in next
    self.current_page = self.page_iterator.next()
  File "/usr/local/lib/python2.7/dist-packages/tweepy/cursor.py", line 98, in next
    data = self.method(max_id = max_id, *self.args, **self.kargs)
  File "/usr/local/lib/python2.7/dist-packages/tweepy/binder.py", line 200, in _call
    return method.execute()
  File "/usr/local/lib/python2.7/dist-packages/tweepy/binder.py", line 176, in execute
    raise TweepError(error_msg, resp)
tweepy.error.TweepError: [{'message': 'Rate limit exceeded', 'code': 88}]

对于任何在 Google 上偶然发现这一点的人来说，tweepy 3.2+ 有额外的参数tweepy.api http://docs.tweepy.org/en/v3.2.0/api.html#API类，特别是：

wait_on_rate_limit– 是否自动等待速率限制补充
wait_on_rate_limit_notify– 当 Tweepy 等待速率限制补充时是否打印通知

将这些标志设置为True将等待委托给 API 实例，这对于大多数简单的用例来说已经足够了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

twitter

tweepy

使用 Tweepy 避免 Twitter API 限制的相关文章

如何使用python登录页面，该页面需要服务器在第一次请求时响应会话ID？

我正在编写一个脚本来登录某个网页我使用 request 和 request session 模块来实现此目的在使用登录参数的第一个请求时服务器响应一个会话 ID 如何设置该会话 ID 以进一步登录到同一页面 url some url
Keras model.summary() 结果 - 了解参数数量

我有一个简单的神经网络模型用于使用 Keras Theano 后端从用 python 编写的 28x28px 图像中检测手写数字 model0 Sequential number of epochs to train for nb ep
当语料库有100亿个独特的DNA序列时，如何使用BK树实现快速模糊搜索引擎？

我正在尝试使用BK tree https news ycombinator com item id 14022424python 中的数据结构用于存储约 100 亿个条目的语料库 1e10 以实现快速模糊搜索引擎一旦我添加超过 1000
如何将人物传奇带到前台？

我有一系列子图其中每个子图都有一个图例我想在每个子图之外与相邻子图重叠问题在于图例位于其自己的图的顶部但位于相邻图的下方 Legend 不将 zorder 作为参数所以我不知道如何解决这个问题这是我使用过的代码 import
如何在 Python 2.4 CSV 阅读器中禁用引用？

我正在编写一个 Python 实用程序需要解析一个我无法控制的大型且定期更新的 CSV 文件该实用程序必须在仅提供 Python 2 4 的服务器上运行 CSV 文件根本不引用字段值但Python 2 4版本的csv库 http ww
如何将 UPX 与 pyinstaller 一起使用？

如何将 UPX 与 pyinstaller 一起使用我正在关注文档我已经下载了UPX 我的文件如下所示 import csv import selenium import pandas print Hello 然后我运行 pyinsta
Python，将字典存储在数据库中

在数据库中存储和检索 python 字典的最佳方法是什么如果您对使用传统 SQL 数据库例如 MySQL 不是特别感兴趣您可以研究非结构化文档数据库其中文档自然映射到 python 字典例如MongoDB http www mon
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
如何将嵌套的Python字典转换为简单的命名空间？

假设我有一个深度为 N 的嵌套字典如何将每个内部嵌套字典转换为简单的命名空间 example input key0a test key0b key1a key2a keyNx key2b test key1b test example o
Django“模型”对象不可迭代

我有一张表其中显示了已注册的员工我想根据他们的数据库生成一个简单的 HTML 页面其中包括他们的姓名 id 职称等为此我将一个 id 传递给视图以便它可以获取相应用户的详细信息并向我显示一切正常直到出现错误对象不可迭代下面
self.__dict__.update(**kwargs) 的风格是好是坏？

在 Python 中假设我有一些类 Circle 它继承自 Shape Shape 需要 x 和 y 坐标此外 Circle 需要半径我希望能够通过执行类似的操作来初始化 Circle c Circle x 1 y 5 r 3 Cir
使用 matplotlib 设置或固定二元分布值

I ve animated a bivariate gaussian distribution using matplotlib 我已经计算过这个distribution通过调整COV matrix来考虑特定的变量我可以提供有关此过程的更
模拟类：Mock() 还是 patch()？

我在用mock http www voidspace org uk python mock index html使用Python 想知道这两种方法中哪一种更好阅读更Pythonic 方法一只需创建一个模拟对象并使用它代码如下 def
如何打印和显示子进程 stdout 和 stderr 输出而不失真？

也许有人可以帮助我解决这个问题我在 SO 上看到了许多与此类似的问题但没有一个问题同时处理标准输出和标准错误也没有处理像我这样的情况因此出现了这个新问题我有一个 python 函数它打开一个子进程等待它完成然后输出返回代码以
如何使用 PyAudio 选择特定的输入设备

通过 PyAudio 录制音频时如何指定要使用的确切输入设备我的电脑有两个麦克风一个内置一个通过 USB 我想使用 USB 麦克风进行录音这流类 https people csail mit edu hubert pyaudio
Pandas：按日历周分组，然后绘制真实日期时间的分组条形图

EDIT 我找到了一个非常好的解决方案并将其发布在下面作为答案结果将如下所示您可以为此问题生成一些示例数据 codes list ABCDEFGH dates pd Series pd date range 2013 11 01 201
Python 对列表中的值求和（如果它存在于另一个列表中）

我有一个列表和一组 a list 1 2 2 1 1 1 b list 1 2 我正在寻找对应 b list 中的项目并将它们从 a list 中的值相加以便输出为 1 3 2 1 我尝试过的 sum 0 for i in a list
混合两个列表的Pythonic方法[重复]

这个问题在这里已经有答案了我有两个长度为 n 和 n 1 的列表 a 1 a 2 a n b 1 b 2 b n 1 我想要一个函数作为结果给出一个列表其中包含两个中的替代元素即 b 1 a 1 b n a n b n 1 以下方法有
使用 Devise 和 Rails 从 Twitter Oauth 获取电子邮件

我已经设置了一个基本的 Rails 应用程序来使用 twitter oauth gem 和设计并且已经能够登录用户但是我的问题是我现在已将我的应用程序列入白名单并且我想在响应中收到用户的电子邮件我已遵循 Twitter 端的所有必
真实值与预测值的降维可视化

我有一个数据框如下所示 label predicted F1 F2 F3 F40 major minor 2 1 4 major major 1 0 10 minor patch 4 3 23 major patch 2 1 11 min

随机推荐

如何找到数组中最长的连续数字链

例如我们有 0 1 3 5 7 8 9 10 12 13 结果一定是7 8 9 10因为它们在索引方面彼此相邻并且是连续的整数而且这个链比0 1 英语不是我的母语如果文笔有点晦涩请见谅使用将项目分组为子序列itertools gro
为什么 Flink SQL 对所有表使用 100 行的基数估计？

我不确定为什么逻辑计划没有被正确评估这个例子 https stackoverflow com questions 53601410 apache flink enable join ordering 53981000 53981000 我更
将 F# 添加到 Visual Studio 2010 C# Express - 可能吗？

我的问题涉及会有 F Express 版本吗 https stackoverflow com questions 977132 will there be a f express edition 鉴于没有 VS 2010 F Expres
如何使用函数身份验证或 Azure AD 服务主体对 Azure 函数进行身份验证

我有一个 Azure 函数用于从 Azure AD 获取数据但我想限制谁可以使用该函数因为它将使用 HTTP 触发器以便我稍后能够从逻辑应用程序调用该函数沿着路因此由于 HTTP 触发的 Azure Functions 具有公共
Objective-C 结构体属性的键值编码

根据苹果的文档键值编码编程指南 http developer apple com library ios documentation cocoa conceptual KeyValueCoding Articles DataTypes ht
FasterCSV：读取远程 CSV 文件

我似乎无法让它发挥作用我想从不同的网络服务器中提取 CSV 文件以在我的应用程序中读取我想这样称呼它 url http www testing com test csv records FasterCSV read url header
SDN BeforeSaveEvent 在保存实体之前捕获事件！= T

目前我已经集中了Id在 BeforeSave 应用程序事件中创建每个 NodeEntity 像这样的东西 Inject IdentifierFactory identifierFactory Bean ApplicationListener
代码问题：格式字符串不是字符串文字[重复]

这个问题在这里已经有答案了可能的重复 SnowLeopard Xcode 警告格式不是字符串文字也没有格式参数 https stackoverflow com questions 1677824 snowleopard xcode w
为什么即使在刷新和使用 -u 时，python 也会继续缓冲标准输出？

cat script py import sys for line in sys stdin sys stdout write line sys stdout flush cat script py python u script py 输
通过引用更新树结构中的项目并返回更新后的树结构

我目前正在使用 HyperappJS V2 和 RamdaJS 学习函数式编程我的第一个项目是一个简单的博客应用程序用户可以在其中对帖子或其他评论进行评论评论以树形结构表示我的状态看起来像这样 state js export def
无法应用 AppCompatActivity 中的 setSupportActionBar (androidx.appcompat.widget.Toolbar)

在 Android Studio 上工作时显示不兼容类型的错误 Android 小部件工具栏无法在 Java 编译器中转换 Toolbar toolbar Toolbar findViewById R id toolBar toolbar
优化级别为 -O2 的 boost::any_range 会导致崩溃

这段代码有什么问题 include
doxygen 中的方程

我将 amsmath 包含在我的 doxygen 中我写道 f equation x 2 f 但 doxygen 的结果是 begin equation x 2 end equation 而不是方程 x 2 有谁知道出了什么问题吗你做得
如何提高通过流下载大尺寸 azure blob 文件的性能？

我有大小约为 212 MB 的 JSON blob 文件在本地调试时下载大约需要 15 分钟当我将代码部署到 Azure 应用程序服务时它运行了 10 分钟并失败并出现错误在本地它间歇性失败并出现相同的错误服务器无法验证请求
如何在coldfusion中获取当前页面URL？我在获取当前页面 URL 时获取 home_page_URL/index.cfm

我正在使用下面的代码来获取 Coldfusion 中的当前页面 URL host structKeyExists cgi http host cgi http host req url https host cgi script name
量角器错误，意外标记）

我正要开始学习量角器并遵循其中的简单教程http www protractortest org tutorial http www protractortest org tutorial 但不幸的是运行此命令后出现奇怪的错误protract
在不影响布局的情况下增大内联链接的可点击区域

我希望使链接的可点击区域比实际的可访问性更大因为对于目标用户来说点击它们可能很困难大约 1 5 倍的尺寸可能比较合适这些是普通文本中的链接因此我实际上无法将它们放大这会弄乱布局我利用 HTML5 CSS3 JS 甚至 Mozi
asp.net mvc4 无法从 json 正确反序列化和绑定 Dictionary>

JSON NET 反序列化它很好但是无论 mvc 用于控制器参数绑定的是什么都很难我还可以做其他事情来完成这项工作吗位 public partial class Question public Dictionary
enable_if 中的短路运算符

我想编写一个模板化函数它需要一个array
使用 Tweepy 避免 Twitter API 限制

我在 Stack Exchange 上的一些问题中看到限制可能是每 15 分钟请求数量的函数并且还取决于算法的复杂性只不过这不是一个复杂的算法所以我使用这段代码 import tweepy import sqlite3 import

使用 Tweepy 避免 Twitter API 限制

使用 Tweepy 避免 Twitter API 限制 的相关文章

随机推荐

热门标签

使用 Tweepy 避免 Twitter API 限制的相关文章