Reddit API 返回无用的 JSON

2024-05-16

我正在尝试使用 Reddit 的 API 和 Python 的 urllib2 从 Reddit 抓取新故事，但我不断收到如下 JSON 文档：

{ u'kind': u'Listing', u'data': { u'modhash': u'', u'children': [], u'after': None, u'before': None }}

这是我的代码：

import json
import time
import urllib2

def get_submissions(after=None):
    url = 'http://reddit.com/r/all/new.json?limit=100'
    if after:
        url += '&after=%s' % after

    _user_agent = 'Reddit Link Analysis Bot by PirateLogic @ github.com/jamesbrewer'
    _request = urllib2.Request(url, headers={'User-agent': _user_agent})
    _json = json.loads(urllib2.urlopen(_request).read())   

    return [story for story in _json['data']['children']], _json['data']['after']

if __name__ == '__main__':
    after = None
    stories = []
    limit = 1
    while len(stories) < limit:
        new_stories, after = get_submissions(after)
        stories.extend(new_stories)
        time.sleep(2) # The Reddit API allows one request every two seconds.
        print '%d stories collected so far .. sleeping for two seconds.' % len(stories)

我写的内容相当简短直接，但我显然忽略了一些东西，或者我没有完全理解 API 或 urllib2 的工作原理。

这是一个示例页面 http://www.reddit.com/r/all/new.json?limit=100来自 API。

这是怎么回事？

EDIT尝试在另一个浏览器中加载示例页面后，我还看到了我在页面顶部发布的 JSON。不过，它似乎仅适用于 //new.json 。如果我尝试 //hot.json 或只是 /.json，我会得到我想要的。

Edit：截至 2013 年 2 月 22 日，期望的new排序不再需要sort=new作为 URL 参数添加。这是因为rising下不再提供排序/new路线，但由提供/rising [source http://www.reddit.com/r/changelog/comments/191ngp/reddit_change_rising_is_now_its_own_tab_instead/].

网址的问题http://reddit.com/r/all/new.json?limit=100 http://reddit.com/r/all/new.json?limit=100那是new页面默认使用rising种类。如果您已登录，并且已将默认排序更改为new那么你真正看到的是页面的结果。注意添加参数sort=new.

因此结果是正确的，只是 /r/all 的上升视图尚未更新。

在相关说明中，我强烈建议使用PRAW https://github.com/praw-dev/praw/wiki（python reddit API 包装器）如果您计划使用 API 的多个部分，而不是编写自己的代码。这是您想要的相关代码：

import praw
r = praw.Reddit('YOUR DESCRIPTIVE USER AGENT NAME')
listing = list(r.get_subreddit('all').get_new_by_date())
print listing

如果您只想迭代提交，您可以省略list() part.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

urllib2

Reddit API 返回无用的 JSON 的相关文章

Python 中的字节数组

如何在 Python 中表示字节数组如 Java 中的 byte 我需要用 gevent 通过网络发送它 byte key 0x13 0x00 0x00 0x00 0x08 0x00 在Python 3中我们使用bytes对象也称为s
PyQt：如何通过匿名代理使用网页

这真让我抓狂我想在 QWebPage 中显示一个 url 但我想通过匿名代理来实现 Code setting up the proxy proxy QNetworkProxy proxy setHostName 189 75 98 199
即使页面未完全加载，我们也可以使用 Selenium 获取页面源吗（TimeoutException: Message: timeout）？

即使遇到 TimeoutException Message timeout 也能获取页面源码吗当我调用 driver page source 时有时无法加载整页但我只需要它的部分信息尚未确定所以我只想在任何情况下保存页面是否可以
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
由于 json 字符串化 dict 键导致数据丢失

考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
Python]将两个文本文件合并为一个（逐行）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是蟒蛇新手我想做的是将文件 a 和文件 b 逐行合并到一个文件中例如 text file a a n b n c text fi
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
Django 模型：如何使用 mixin 类来覆盖 django 模型以实现 save 等功能

我想在每次保存模型之前验证值所以我必须重写保存函数代码几乎是一样的我想把它写在 mixin 类中但失败了我不知道如何写 super func 我英语不好抱歉 class SyncableMixin object def sav
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X

随机推荐

Android：autoLink 在我的 4.4 设备上无法正常工作

我是 Android 编程新手我遇到了这个奇怪的问题我想让列表中的电话号码可点击他们会向您发送拨号器现在这在我的 Android 手机上有效但它似乎只适用于数字10 个字符但是当我在 4 1 2 的虚拟设备上测试它时它在列表中
Ant设计文件上传中使用customRequest

我正在使用 Axios 来处理文件上传我遇到显示文件上传进度的问题我使用的文件上传视图是图片卡 HTML
如何处理 PHP 中浮点数的奇怪舍入

众所周知浮点运算并不总是完全准确但是如何处理它的不一致之处呢 As an example in PHP 5 2 9 this doesn t happen in 5 3 echo round 14 99225 4 14 9923 ech
Android 选项菜单中的本地图标拉伸以填充菜单项，标题模糊

我是新人所以链接和图片是here https sites google com site nolanramy Hi 我可能犯了一个愚蠢的错误希望找出那是什么我想在我的应用程序的选项菜单中使用一些标准菜单图标 ic menu refre
php 或 zend 中国际电话号码验证的正则表达式是什么？

我有一个 zend 表单其中有一个电话号码字段并且必须检查验证器我决定为此使用正则表达式我搜索了谷歌但我得到的结果不起作用谁能给我提供正则表达式这是我的代码 phone new Zend Form Element Text p
如何根据条件删除结果以计算平均值

我有下面的架构对其的快速解释是鲍勃评分为 5 5 詹姆斯评分 1 5 梅西百货评分高达 5 5 逻辑如果我是 A 请查找我屏蔽的所有人查阅所有电影评论任何留下电影评论且 personA 已屏蔽的人请将其从计算中删除计算电影的平
如何设置 Android AVD（SDK 2.1 和 2.2）的默认值（语言和键盘）

我最近升级到 Android SDK 2 1 和 2 2 但 AVD 始终显示活动的中文和日文字符我可以进入设置取消选中这些选项但这变得很痛苦如何设置语言和键盘默认值以避免这种麻烦谢谢 CommonsWare 的评论就是答案您
Java GSON：获取JSONObject下所有键的列表

我已经将 GSON 作为 Java 中的 JSON 解析器但密钥并不总是相同例如我有以下 JSON 我已经知道的对象键1 值1 键2 值2 AnotherObject anotherKey1 anotherValue1 anothe
jQuery：如何仅根据表标题从表的列中选择值

我有一个带有标题 ID 的表我需要选择此标题下的所有字段我无权访问源代码并且该表中没有使用任何类关于如何完成这件事有什么想法吗要获取第一列 function var col td nth child 1
使用 ng-options 在 AngularJS 中使用 JSON 填充 select

编辑我的代码实际上确实有效我只是一个有不相关问题的白痴感谢大家的意见所以我有一个 JSON 对象数组格式如下 id id1 text text1 id id2 text text2 我想使用这些填充 AngularJS 选择字段
curl 无法获取网页内容，为什么？

我正在使用curl 脚本转到链接并获取其内容以进行进一步操作以下是链接和curl脚本
使用不同的 conda-build 根目录

我正在创建我自己的 conda 食谱我用 git 签出存储库很少有演出而不是在结帐 conda bld 我希望结账于 ssd 这会更快我怎样才能指定它另外在进行克隆时如何指定 git 深度我想结账 ssd这会更快我怎样才能指
在 Spark 结构化流 2.3.0 中连接两个流时，左外连接不发出空值

两个流上的左外连接不发出空输出它只是等待记录添加到另一个流中使用套接字流来测试这一点在我们的例子中我们想要发出具有 null 值的记录这些记录与 id 不匹配或且不属于时间范围条件水印和间隔的详细信息如下 val ds1Map
如何删除最后一次出现模式后的所有行？

我想删除最后一次出现模式之后的所有行除了模式本身 file txt honor apple redmi nokia apple samsung lg htc file txt 我想要什么 honor apple redmi nokia a
为什么 HTML5 视频无法在 google chrome 上运行？

my code
Elasticsearch 通过 id 获取不起作用但文档存在

我在 elasticsearch 1 2 0 最近从 1 0 1 升级上看到 ids 的奇怪行为搜索检索我的文档显示 id 的正确值终端 curl myServer 9200 global search q someField so
从 json 数组获取值并执行 sql 插入

这是我的数组 json 1 Device ID a9a3346be4375a92 Date 2012 05 31 Time 15 22 59 Latitude 51 4972912 Longitude 0 1108178 2 Device
如何从 GestureListener.Gesture 触发 EventToCommand

有人使用 Toolkit GestureListener 来触发 EventToCommand 吗我认为您无法使用 EventToCommand 行为来做到这一点但我创建了一种行为允许通过将 GestureListener 绑定到命令
基于另一个组合框的所选项目绑定组合框 - MVVM WPF

我目前有一个组合框其中填充了艺术家姓名一旦选择了艺术家我需要将其绑定到另一个组合框在我看来这些设置如下
Reddit API 返回无用的 JSON

我正在尝试使用 Reddit 的 API 和 Python 的 urllib2 从 Reddit 抓取新故事但我不断收到如下 JSON 文档 u kind u Listing u data u modhash u u children u

Reddit API 返回无用的 JSON

Reddit API 返回无用的 JSON 的相关文章

随机推荐

热门标签