Tweepy：传输数据 X 分钟？

2024-03-22

我正在使用 tweepy 来数据挖掘公共推文流中的关键字。这非常简单，并且已在多个地方进行了描述：

http://runnable.com/Us9rrMiTWf9bAAW3/how-to-stream-data-from-twitter-with-tweepy-for-python http://runnable.com/Us9rrMiTWf9bAAW3/how-to-stream-data-from-twitter-with-tweepy-for-python

http://adilmoujahid.com/posts/2014/07/twitter-analytics/ http://adilmoujahid.com/posts/2014/07/twitter-analytics/

直接从第二个链接复制代码：

#Import the necessary methods from tweepy library
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream

#Variables that contains the user credentials to access Twitter API 
access_token = "ENTER YOUR ACCESS TOKEN"
access_token_secret = "ENTER YOUR ACCESS TOKEN SECRET"
consumer_key = "ENTER YOUR API KEY"
consumer_secret = "ENTER YOUR API SECRET"


#This is a basic listener that just prints received tweets to stdout.
class StdOutListener(StreamListener):

    def on_data(self, data):
        print data
        return True

    def on_error(self, status):
        print status


if __name__ == '__main__':

    #This handles Twitter authetification and the connection to Twitter Streaming API
    l = StdOutListener()
    auth = OAuthHandler(consumer_key, consumer_secret)
    auth.set_access_token(access_token, access_token_secret)
    stream = Stream(auth, l)

    #This line filter Twitter Streams to capture data by the keywords: 'python', 'javascript', 'ruby'
    stream.filter(track=['python', 'javascript', 'ruby'])

我不明白的是如何将这些数据流式传输到 python 变量中？而不是将其打印到屏幕上...我正在 ipython 笔记本中工作并希望捕获某个变量中的流，foo直播一分钟左右后。此外，如何让流超时？它以这种方式无限期地运行。

使用 tweepy 访问 Twitter 的 Streaming API https://stackoverflow.com/questions/10970550/using-tweepy-to-access-twitters-streaming-api?rq=1

是的，@Adil Moujahid 在帖子中提到他的代码运行了 3 天。我改编了相同的代码并进行了初始测试，进行了以下调整：

a) 添加了位置过滤器以获取有限的推文，而不是包含关键字的通用推文。看如何向 tweepy 模块添加位置过滤器 https://stackoverflow.com/questions/22889122/how-to-add-a-location-filter-to-tweepy-module。从这里，您可以在上面的代码中创建一个中间变量，如下所示：

stream_all = Stream(auth, l)

假设我们选择旧金山地区，我们可以添加：

stream_SFO = stream_all.filter(locations=[-122.75,36.8,-121.75,37.8])

假设过滤位置的时间小于过滤关键字的时间。

(b) 然后您可以过滤关键字：

tweet_iter = stream_SFO.filter(track=['python', 'javascript', 'ruby'])

with open('file_name.json', 'w') as f:
        json.dump(tweet_iter,f,indent=1)

这应该花费更少的时间。我碰巧想回答您今天发布的同一问题。因此，我没有执行时间。

希望这可以帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tweepy：传输数据 X 分钟？的相关文章

AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
当图例位于轴之外时选择 matplotlib 图例

当我修改 legend picking py 示例时我遇到了一个有趣的怪癖其中图例位于轴之外如下所示 leg ax legend loc upper left fancybox True shadow True leg ax lege
动态添加jinja模板

我有一个 jinja 模板它是一组 div 标签内的唯一内容 div include temppage html div 当我按下按钮时我想用其他内容替换标签之间的所有内容我希望用另一个 jinja 模板 include realpa
如何为 apscheduler 指定“记录器”

我正在尝试学习如何使用 Python 的 apscheduler 包但它会定期抛出以下错误 No handlers could be found for logger apscheduler scheduler 该消息似乎与计划作业中的错
Python：按条件绘制多个正/负条形图

这是我第一次用 python 绘制条形图我的 df 操作 key descript score 0 noodles taste 5 1 noodles color 2 2 noodles health 3 3 apple color 7
如何使用scrapy抓取xml url

你好我正在使用 scrapy 来抓取 xml url 假设下面是我的 Spider py 代码 class TestSpider BaseSpider name test allowed domains www example com s
Scrapy 未通过请求回调从项目中的已抓取链接返回附加信息

基本上下面的代码会抓取表格的前 5 项其中一个字段是另一个 href 单击该 href 会提供更多信息我想收集这些信息并将其添加到原始项目中所以parse应该将半填充的项目传递给parse next page然后刮掉下一位并返回完成
使用 scikit 包在 Python 中绘制集群区域的边界

这是我处理 3 个属性 x y 值中的数据聚类的简单示例每个样本代表其位置 x y 及其所属变量我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random
如何在海龟图形中将多个按键绑定在一起？

我正在尝试制作一个连接点的 python 游戏我希望游戏记录 2 次按钮按下操作示例如果用户按向上和向右箭头键乌龟将向东北方向移动 45 度这是我的代码 import turtle flynn turtle Turtle win
使用 RGB 数据将输入数据剪切到 imshow 的有效范围（对于浮点数为 [0..1]，对于整数为 [0..255]）

我尝试将 MRI 切片转换为 PNG 格式后运行图形切割算法我不断遇到以下问题 Clipping input data to the valid range for imshow with RGB data 0 1 for floats
如何从分组数据创建直方图

我正在尝试根据 pandas 中的分组数据创建直方图到目前为止我已经能够创建标准线图但我不知道如何做同样的事情来获取直方图条形图我想获得泰坦尼克号事故中幸存者和未幸存者的 2 个年龄直方图看看年龄分布是否存在差异来源数据 ht
Pandas：将 DataFrame 列值转换为新的 Dataframe 索引和列

我有一个如下所示的数据框 a b c 0 1 10 1 2 10 2 2 20 3 3 30 4 1 40 4 3 10 上面的数据帧作为默认索引 0 1 2 3 4 我想将其转换为如下所示的数据框 1 2 3 0 10 0 0 1 0 1
加载 IPython 笔记本时出错

一旦我用 Jupyter 打开笔记本文件它要求我转换文件我就再也无法在标准 IPython 笔记本中打开它了我收到以下错误 Error loading notebook Bad Request 2014 12 21 04 13 03
Unpivot Pandas 数据

我目前有一个DataFrame布置为 Jan Feb Mar Apr 2001 1 12 12 19 2002 9 2003 我想将数据逆透视使其看起来像 Date Value Jan 2001 1 Feb 2001 1 Mar 200
Python Pandas DateOffset 使用另一列中的值

我以为这会很容易但下面的内容并不适合我想要的只是尝试通过使用另一列中的值将天数添加到预先存在的日期时间列来计算新的日期列我下面的偏移列只有 1 位数字 df new date df orig date apply lambda x
使用 MinGW 链接到 Python

我不想创建一个嵌入Python解释器的跨平台程序并用MinGW编译它但是 Python 二进制发行版没有提供 MinGW 链接的库仅python32 lib对于 Visual C 并且 Python 源包不提供使用 MinGW 编译的
获取 pandas 中最后一次出现特定值之后的所有行

我的数据框看起来像 ID colA 1 B 1 D 2 B 2 D 2 C 我已返回每组中事件 B 最后一次出现后的所有行输出将是 ID colA 1 D 2 D 2 C 我试过 a df colA str contains B grou
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
类型提示：解决循环依赖

以下产生NameError name Client is not defined 我该如何解决 class Server def register client self client Client pass class Client de
为什么 Python ggplot 返回名称“aes”未定义？

当我使用以下命令时 p ggplot aes x DTM y TMP1 data data 我收到以下错误 NameError name aes is not defined 你可以帮帮我吗你需要导入aes from ggplot imp

随机推荐

如何使用 d3.js 以编程方式触发拖动事件？

我编写了一些对 svg 元素使用拖动事件的代码该代码运行良好我想为其编写一些测试我不想手动移动鼠标而是想以编程方式触发dragstart and drag事件与选择调度 https github com d3 d3 selecti
VHDL - FSM 未启动（仅在时序仿真中）

我正在写我的硕士论文而且我对 VHDL 还很陌生但我仍然必须实现一些复杂的东西这是我必须编写的最简单的结构之一但我仍然遇到了一些问题它是一个 FSM 采用低电平有效同步信号用于对 DAC 进行编程实现 24 位移位寄存器这只
在 jqgrid 中动态将 rownumbers 设置为 false

我喜欢使用以下命令在网格中显示行号rownumbers财产但如果只返回一行有没有办法设置rownumbers动态为 false 为什么乍一看在没有标题的列中看到 1 有点令人困惑但如果有多行那么您很快就会意识到该列的用途你可以
通过 DOM、insertAdjacentHTML 或 document.write 将 SCRIPT 添加到 IFRAME

我需要将 SCRIPT 添加到沙盒 IFRAME 中并且我试图避免使用document write see here https stackoverflow com questions 4537963 what are alternati
如何删除使用 Uri 创建的文件？

我的应用程序从相机拍摄照片并将其保存在一个文件中该文件的 Uri 存储在 SQL 数据库中使用数据库中的 Uri 初始化位图可以完美地工作但是当我尝试使用数据库中的 Uri 初始化文件然后使用删除时imagefile delete
使用 Ansible“lineinfile”模块编辑 /etc/sudoers 是否安全？

我想根据以下内容更改 sudo 会话超时this https superuser com a 149740 775166回答我可以编辑普通文件 lineinfile path etc sudoers regexp Defaults env
将 ggplot 中的背景部分更改为不同的颜色[重复]

这个问题在这里已经有答案了使用以下数据框d day lt gl 8 1 24 labels c Mon Tues Wed Thurs Fri Sat Sun Avg day lt factor day level c Mon Tues W
使用POSTMAN时不会出现CORS问题

我已经使用 POSTMAN 发送一段时间了HTTP requests like GET POST PUT用于 RESTful Web 服务最近遇到一种情况当通过浏览器向我的 REST API 发送请求时我收到一条消息请求的资源上不存
如何在django中检查多对多字段的类型？

如何检查 django 中多对多字段的类型我想这样做 import django field class django db models fields related ManyRelatedManager 这是行不通的因为类ManyR
DynamoDBMapper 负载与查询

DynamoDBMapper 提供了从表中读取一项的不同方法 query load 有推荐吗该使用哪一个在快速测试中以下两个代码片段对于主键哈希和范围键日期的表返回相同的 MyEntry 项而查询方法大约快 10 load pu
Spring-Core-WS 与 Spring 4.3.0 不兼容，是吗？

我总是尝试在我的 Spring 项目中使用最新的 jars api 我们有一个 Spring 4 2 4 RELEASE 然后我升级到 4 3 0 一切都构建和编译得很好但是当我尝试运行单元测试时我收到一条错误消息我确实追踪到 Sp
在 Wpf 应用程序中查看 Byte[] Pdf

你好我在 Byte 中找到了一些 pdf 文件我正在寻找一种在 WPF 应用程序中查看它们的方法我已经看过了http hugeonion com 2009 04 06 displaying a pdf file within a wp
将 .hide() 和 .show() 与 Google Visualization 结合使用

我用谷歌可视化创建了一个折线图我已经测试过它并且它按预期工作问题是当我在可视化上使用 hide 启动页面然后单击按钮显示它时它不会显示可视化这是我所拥有的内容的精简版本
如何解压缩字节数组中的 gzip 数据？

我有一个类它有一个接收对象作为参数的方法该方法通过 RMI 调用 public RMIClass extends Serializable public RMIMethod MyFile file do stuff MyFile 有一个
如何在两个不同的选项卡上显示相同的控件？

我正在使用VB NET 我需要在两个不同的选项卡上显示相同的控件 ListBox 是否必须创建 2 个不同的 ListBox 实例如果您不需要设计时支持您可以简单地在运行时将 ListBox 实例的父级从一个选项卡更改为另一个选项卡当
开玩笑“toMatchSnapshot”会导致“超出最大调用堆栈大小”

我正在尝试测试组件上的快照但收到错误RangeError Maximum call stack size exceeded 虽然当我删除toMatchSnapshot 错误消失了我在多个组件上都发生过这种情况这是一个例子我的项目是使
如何修复 Type '{ [key in K]:unknown; } & S["data"]' 不可分配给 TypeScript 中的类型 'ScopeFormDataType'

我有这个TypeScript 游乐场 https www typescriptlang org play code KYDwDg9gTgLgBMAdgVwLZwMoGMJmHAbwCg44AxadAXjgCIAzS2gGhLgDlgBneG
time.perf_counter() 应该在 Windows 上的 Python 中跨进程保持一致吗？

UPDATE 此错误的修复已提交并将在 Python 3 10 中首次亮相预计将于 2021 年 10 月发布请参阅错误报告 https bugs python org issue37205 msg381107了解详情的文档time
将光标移动到 QTextEdit 内部

我有一个表格QTextEdit其上称为translationInput 我正在尝试为用户提供编辑功能 This QTextEdit将包含 HTML 格式的文本我有一组按钮例如 bold Italic 等等这应该将相应的标签添加到文档
Tweepy：传输数据 X 分钟？

我正在使用 tweepy 来数据挖掘公共推文流中的关键字这非常简单并且已在多个地方进行了描述 http runnable com Us9rrMiTWf9bAAW3 how to stream data from twitter with

Tweepy：传输数据 X 分钟？

Related:

Tweepy：传输数据 X 分钟？ 的相关文章

随机推荐

热门标签

Tweepy：传输数据 X 分钟？的相关文章