使用 PRAW 获得超过 100 个搜索结果?

2023-11-28

我使用以下代码通过 PRAW 4.4.0 获取 reddit 搜索结果:

params = {'sort':'new', 'time_filter':'year'}
return reddit.subreddit(subreddit).search('', **params)

我想从 Reddit 子版块中抓取无限量的帖子,持续时间最长为一年。 Reddit 的搜索功能(以及相应的 API)通过“after”参数实现了这一点。但是,上述搜索函数不接受“after”作为参数。有没有办法使用PRAW的.search()来获得100条以上的搜索结果?


是的,通过发送参数limit=None会将其增加到 1000,但不会保证任何时间范围,并且无法获取超过 1000 个。但是您可以使用 cloudsearch 语法。 reddit wiki 中有详细描述https://www.reddit.com/wiki/search#wiki_cloudsearch_syntax并且是非常强大的搜索增强器。

为了用一些代码支持它,可以通过以下方式实现像本例这样的示例用法:

import datetime
params = {'sort':'new', 'limit':None, 'syntax':'cloudsearch'}
time_now = datetime.datetime.now()
return reddit.subreddit(subreddit).search('timestamp:{0}..{1}'.format(
    int((time_now - datetime.timedelta(days=365)).timestamp()),
    int(time_now.timestamp())),
    **params)

每个查询的结果限制为 1000 个,但由于指定的时间范围,您可以针对不同的时间范围多次查询。 IE。抢1000份提交,获得utc_time从最旧的时间开始并将该时间作为时间戳的第一个参数发送,这将为您提供从上次查询停止的时间点开始的结果。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 PRAW 获得超过 100 个搜索结果? 的相关文章

随机推荐

  • 今天、本周、本月流行 - 设计模式

    我有一个系统 显示按三个字段之一排序的条目 即最流行的 今天 本周 和 本月 每次查看条目时 分数都会增加 1 从而改变顺序 因此 如果条目 1 是新条目并且今天被浏览了 10 次 那么它的分数将为 Today 10 Week 10 Mon
  • 使用委托会产生垃圾吗

    我正在使用 XNA 为 xbox360 开发一款游戏 与 PC 上的垃圾收集器相比 Xbox 上的垃圾收集器的性能相当糟糕 因此将垃圾生成量降至最低对于顺利运行游戏至关重要 我记得曾经读过 调用委托会产生垃圾 但现在我找不到任何对委托创建垃
  • 如何刷新访问令牌

    我有一个 Asp net2 0核心 Web 应用程序连接到 Identity server 4 应用程序进行身份验证 还有一个涉及到的API API 使用访问令牌作为承载令牌 我的创业 services AddAuthentication
  • jquery live 的替代方案可以工作

    我有这个简单的代码 http jsfiddle net borth BmEZv 如果您单击该链接一次 它就可以正常工作 如果你点击第二次 它就不起作用了 由于 html 是在 DOM 加载后才加载到 html 中的 所以我尝试过 on bi
  • Bootstrap 下拉子菜单丢失

    Bootstrap 3 仍处于 RC 阶段 但我只是在尝试实现它 我不知道如何放置子菜单类 即使 css 中没有类 甚至新文档也没有提及任何内容 它在 2 x 中存在 类名称为下拉子菜单 Bootstrap 5 2023 年更新 添加一些
  • 如何使用 Gradle 和 Spring Boot 捕获构建信息

    我正在尝试访问构建信息值 例如version在我的 Java 主应用程序中使用 Spring Boot 和 Gradle 我找不到任何有关如何配置的文档 示例 build gradle application yml 如果需要的话 Java
  • 阿拉伯字符编码问题:UTF-8 与 Windows-1256

    快速背景 我继承了一个包含英语和阿拉伯语文本组合的大型 sql 转储文件 并且 我认为 它最初是使用 latin1 导出的 在导入文件之前 我将所有出现的 latin1 更改为 utf8 阿拉伯语文本在 phpmyadmin 中没有正确显示
  • 将所有使用的Python模块收集到一个文件夹中?

    我认为以前没有人问过这个问题 我有一个包含许多不同 py 文件的文件夹 我制作的脚本只使用了一些 但有些调用了其他脚本 我不知道所有正在使用的脚本 是否有一种程序可以获取使该脚本运行到一个文件夹中所需的一切 Cheers Use the m
  • Character.getNumericValue() 问题

    我可能遗漏了一些东西 但是为什么这两个数值等于 1 System out println Character getNumericValue Character MAX VALUE System out println Character
  • 如何从时间戳列表中获取开始和结束范围?

    我有一个像这样的时间戳字符串 2016 01 14T22 43 55Z 2016 01 15T00 04 50Z 2016 01 15T00 44 59 08 30 2016 01 15T01 25 35 05 00 2016 01 15T
  • 表单未使用 JS 提交

    我有世界上最简单的 JavaScript 函数 fnSubmit window print document formname submit 这是由以下人员调用的
  • 如何以编程方式设置文档字符串?

    我有一个返回函数的包装函数 有没有办法以编程方式设置返回函数的文档字符串 如果我可以写信给 doc 我会做以下事情 def wrapper a def add something b return a b add something doc
  • 工具带安装:找不到 gem Heroku

    当我尝试从应用程序目录中的终端执行任何 Heroku 命令时 收到 无法找到 RubyGem heroku Gem LoadError 消息 已尝试擦除并重新安装 Toolbelt 以及任何以前安装的 Heroku gem 使用完整路径有效
  • 在C#中,如何获取空白的XML节点值?

    我有一个 XML 节点 其值为空格 例子
  • UI线程和其他线程使用handler进行通信

    UI线程和后台线程之间如何进行线程间通信 我想在这里使用通用处理程序概念来更新我的用户界面 我有如下概念 new Thread new Runnable public void run while mProgressStatus lt 10
  • 设置要使用的 JAXB 上下文工厂初始化类

    我已经更新了我们的项目 基于 Java EE 在 Websphere 8 5 上运行 以使用公司内部框架的新版本 以及 Ejb 3 x 部署描述符 而不是 2 x 部署描述符 从那时起 我的集成测试失败 但出现以下异常 java lang
  • 显示图表控件 Xaxis 中的所有值

    我有一张包含一堆产品的图表 总共 35 种 他们放大了 X 轴 该图表绘制得很好 但只显示了 5 个产品名称 而我需要将它们全部显示出来 我已将 MinorTickMark 启用为 true 以便显示所有刻度线 但如何使它们各自的标签可见
  • 免费MySQL同步工具[关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心以获得指导 有人知道一些用于同步 My
  • C++20 概念:GCC 和 Clang 中具有指针类型成员的复合需求表达式的行为差异

    考虑以下代码 Godbolt include
  • 使用 PRAW 获得超过 100 个搜索结果?

    我使用以下代码通过 PRAW 4 4 0 获取 reddit 搜索结果 params sort new time filter year return reddit subreddit subreddit search params 我想从