扭曲的Python getPage

2024-02-23

我试图获得这方面的支持，但我完全感到困惑。

这是我的代码：


from twisted.internet import reactor
from twisted.web.client import getPage
from twisted.web.error import Error
from twisted.internet.defer import DeferredList
from sys import argv

class GrabPage:
 def __init__(self, page):
  self.page = page

 def start(self, *args):
  if args == ():
   # We apparently don't need authentication for this
   d1 = getPage(self.page)
  else:
   if len(args) == 2:
    # We have our login information
    d1 = getPage(self.page, headers={"Authorization": " ".join(args)})
   else:
    raise Exception('Missing parameters')

  d1.addCallback(self.pageCallback)
  dl = DeferredList([d1])
  d1.addErrback(self.errorHandler)
  dl.addCallback(self.listCallback)

 def errorHandler(self,result):
  # Bad thingy!
  pass

 def pageCallback(self, result):
  return result

 def listCallback(self, result):
  print result

a = GrabPage('http://www.google.com')
data = a.start() # Not the HTML

我希望获取调用 start() 时提供给 pageCallback 的 HTML。这对我来说是一个皮塔饼。泰！对我糟糕的编码感到抱歉。

您缺少 Twisted 运作方式的基础知识。这一切都围绕着reactor，你甚至从来没有运行过。像这样思考反应堆：

_{(source: krondo.com http://krondo.com/blog/wp-content/uploads/2009/07/reactor-1.png)}

在启动反应器之前，通过设置延迟，您所做的就是将它们链接起来，没有任何事件可以触发。

我建议你给扭曲的介绍 http://krondo.com/an-introduction-to-asynchronous-programming-and-twisted/ by 戴夫·佩蒂科拉斯 http://krondo.com/一读。它速度很快，并且确实为您提供了 Twisted 文档所没有的所有缺失信息。

无论如何，这是最基本的用法示例getPage尽可能：

from twisted.web.client import getPage
from twisted.internet import reactor

url = 'http://aol.com'

def print_and_stop(output):
    print output
    if reactor.running:
       reactor.stop()

if __name__ == '__main__':
    print 'fetching', url
    d = getPage(url)
    d.addCallback(print_and_stop)
    reactor.run()

Since getPage返回延迟，我正在添加回调print_and_stop到延迟链。之后，我开始reactor。反应堆起火getPage，然后触发print_and_stop它打印来自 aol.com 的数据，然后停止反应器。

编辑以显示 OP 代码的工作示例：

class GrabPage:
    def __init__(self, page):
        self.page = page
        ########### I added this:
        self.data = None

    def start(self, *args):
        if args == ():
            # We apparently don't need authentication for this
            d1 = getPage(self.page)
        else:
            if len(args) == 2:
                # We have our login information
                d1 = getPage(self.page, headers={"Authorization": " ".join(args)})
            else:
                raise Exception('Missing parameters')

        d1.addCallback(self.pageCallback)
        dl = DeferredList([d1])
        d1.addErrback(self.errorHandler)
        dl.addCallback(self.listCallback)

    def errorHandler(self,result):
        # Bad thingy!
        pass

    def pageCallback(self, result):
        ########### I added this, to hold the data:
        self.data = result
        return result

    def listCallback(self, result):
        print result
        # Added for effect:
        if reactor.running:
            reactor.stop()

a = GrabPage('http://google.com')
########### Just call it without assigning to data
#data = a.start() # Not the HTML
a.start()

########### I added this:
if not reactor.running:
    reactor.run()

########### Reference the data attribute from the class
data = a.data
print '------REACTOR STOPPED------'
print
########### First 100 characters of a.data:
print '------a.data[:100]------'
print data[:100]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

twisted

扭曲的Python getPage 的相关文章

上传时的 Google Drive API——这些额外的空行从何而来？

总结一下该程序我从我的 Google 云端硬盘下载一个文件然后在本地计算机中打开并读取一个文件 file a txt 然后在我的计算机中打开另一个文件 file b txt 处于附加模式并且在使用这个新的 file b 更新我的 Go
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
Pyqt-如何因另一个组合框数据而更改组合框数据？

我有一个表有 4 列这 4 列中的两列是关于功能的一个是特征另一个是子特征在每一列中所有单元格都有组合框我可以在这些单元格中打开txt 我想当我选择电影院作为功能时我只想看到子功能组合框中的电影名称而不是我的数据中的
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
使用 Python 计算 Spark 中成对 (K,V) RDD 中每个 KEY 的平均值

我想与 Python 共享这个特定的 Apache Spark 解决方案因为它的文档非常贫乏我想通过 KEY 计算 K V 对存储在 Pairwise RDD 中的平均值示例数据如下所示 gt gt gt rdd1 take 10
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
在 Spyder 的变量资源管理器中查看局部变量

我是 python 新手正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器然而根据一些研究我发现它只显示全局变量我找到的解决方法是使用检查模块 import inspect local vars def m
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
使用 NLP 进行地址分割

我目前正在开发一个项目该项目应识别地址的每个部分例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这

随机推荐

x86-64 中 movq 和 movabsq 的区别

我说的是 x86 64 Intel 架构中的数据移动指令我读过常规的movq指令只能具有可表示为 32 位二进制补码数的立即源操作数而movabsq指令可以将任意 64 位立即数作为其源操作数并且只能将寄存器作为目标您能详细说明一
Docker-compose：如何使用相同的网络地址从容器和主机访问 Localstack 资源

我使用 docker compose 在 2 个独立的容器中运行 python API 和 Localstack 实例以进行本地开发该 API 有一个端点可生成预签名的 AWS S3 URL 并重定向用户以便直接从 S3 加载图像
如何从私有模块中的公共函数引用私有类型？

我想将类似的函数分组在一个文件中这些函数需要返回一个非公开的类型 struct MyStruct mod my mod use super MyStruct There are other similar functions that a
通过 INavigationProvider 将菜单项添加到主菜单但不显示？

使用 Orchard cms 1 5 1 我创建了一个模块其中包含从 Web 服务获取列表的控制器我想在启用此模块时在主菜单中添加一个菜单项为此我创建了主菜单如下 public class MainMenu INavigationP
如何获取 ESRI 地图 - Angular 的屏幕截图

如何在 UI 上获取 Esri 地图当前状态的屏幕截图并将其从 Angular 下载为 Pdf 以下代码是我当前的 ts 代码如果需要添加其他部分请告诉我 esri map component html div div esri map
Javascript crc32 函数和 PHP crc32 不匹配

我正在开发一个 web 应用程序我想将 PHP 中服务器端生成的一些 crc32 值与我在 Javascript 中生成的一些 crc32 值进行匹配两者都使用相同的输入字符串但返回不同的值我在webtoolkit上找到了一个crc3
Python：有吸引力的、干净的、可打包的 Windows GUI 库 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我需要为最终用户下载的桌面应用程序创建一个简单的基于 Windows 的 GUI 该应用程序是用 python 编写的并将打包为安装程序
在c中读取/写入bmp文件

我正在尝试处理 bmp 文件首先我尝试从 bmp 文件读取标题和数据并将其写入新文件 pragma pack push 1 Windows 3 x bitmap file header typedef struct char filet
golang http2 服务器推送的高级客户端

golang 1 6 发布支持 Http2 我在网上搜索但找不到任何有关如何使用 Go 进行 Http2 服务器推送的示例是否有为此实现的高级客户端人们已经做过什么例子了吗 std 库中的 http2 实现不公开 http2 特定的
AngularJS 和 i18next

我见过一些 Angular 的 i18n 插件但我不想重新发明轮子 i18next 是一个很好的库所以我打算使用它我创建了一个指令 i18n 它只调用 i18n 库 define app jquery i18n function ap
按年份划分的R组

我将 csv 读入 R 现在我有了一个数据列表 head data Date Open High Low Close Volume 1 31 Dec 14 223 09 225 68 222 25 222 41 2402097 2 30 D
Android - 使用动画的工件

应用发现的 3D 转换时我遇到屏幕上的视觉伪影问题here http developer android com resources samples ApiDemos src com example android apis animat
d3.js - 变换和过渡，多行

我已按照以下说明进行操作 http bost ocks org mike path http bost ocks org mike path 用于用单线创建单图并对其进行动画处理并且弄清楚如何在图表中创建多条线在 D3 js 中绘制多
代码以交互方式运行时显示结果，但从 shell 运行时不显示结果

我从另一张海报上借用了这个科学记数法小脚本以科学记数法显示小数 https stackoverflow com questions 6913532 python how to convert decimal to scientific n
音频 API 示例中的“安全错误”代码：“1000”

我试图重复这个例子here https wiki mozilla org Audio Data API Complete Example 3a Visualizing Audio Spectrum 但收到此错误 Security error
C# 中的 DataGridView 组合框单元格事件

我想在 DataGridViewComboBox 中的项目发生更改时显示一条消息我可以通过 datagridview CellbeginEdit 事件和 CellEndEdit 事件的帮助来部分执行它但这还不够我希望它发生在组合框选择
如何在ios应用程序中播放RTMP视频流？

嗨我正在开发广播应用程序我正在使用 Videocore 库现在我如何在 ios 应用程序中播放该流视频我尝试使用 MpMoviePlayer 但它不支持 rtmp 流那么是否有任何第三方库可供 RTMP 支持的播放器使用请帮助我
未创建表 sqlite android

我正在制作一个应用程序我想在其中保存用户联系人详细信息但是每当我尝试插入或选择某些值时我都会收到错误数据库代码 public class ContactsDatabase extends SQLiteOpenHelper priva
获取Java中注解的参数值

所以我有一个代码 Path foo public class Hello GET Produces text html public String getHtml Context Request request Context HttpSe
扭曲的Python getPage

我试图获得这方面的支持但我完全感到困惑这是我的代码 from twisted internet import reactor from twisted web client import getPage from twisted web

扭曲的Python getPage

扭曲的Python getPage 的相关文章

随机推荐

热门标签