同时在 python 中运行多个线程 - 这可能吗？

2023-12-30

我正在编写一个小爬虫，它应该多次获取 URL，我希望所有线程同时运行。

我写了一小段代码应该可以做到这一点。

import thread
from urllib2 import Request, urlopen, URLError, HTTPError


def getPAGE(FetchAddress):
    attempts = 0
    while attempts < 2:
        req = Request(FetchAddress, None)
        try:
            response = urlopen(req, timeout = 8) #fetching the url
            print "fetched url %s" % FetchAddress
        except HTTPError, e:
            print 'The server didn\'t do the request.'
            print 'Error code: ', str(e.code) + "  address: " + FetchAddress
            time.sleep(4)
            attempts += 1
        except URLError, e:
            print 'Failed to reach the server.'
            print 'Reason: ', str(e.reason) + "  address: " + FetchAddress
            time.sleep(4)
            attempts += 1
        except Exception, e:
            print 'Something bad happened in gatPAGE.'
            print 'Reason: ', str(e.reason) + "  address: " + FetchAddress
            time.sleep(4)
            attempts += 1
        else:
            try:
                return response.read()
            except:
                "there was an error with response.read()"
                return None
    return None

url = ("http://www.domain.com",)

for i in range(1,50):
    thread.start_new_thread(getPAGE, url)

从apache日志来看，线程似乎没有同时运行，请求之间有一点间隙，几乎无法检测到，但我可以看到线程并不是真正并行的。

我读过有关 GIL 的内容，有没有办法绕过它而不调用 C\C++ 代码？我真的不明白 GIL 是如何实现线程化的？ python 基本上在前一个线程完成后立即解释下一个线程？

Thanks.

正如您所指出的，GIL 通常会阻止 Python 线程并行运行。

然而，情况并非总是如此。一个例外是 I/O 密集型代码。当线程等待 I/O 请求完成时，它通常会在进入等待之前释放 GIL。这意味着其他线程可以同时取得进展。

然而，一般来说，multiprocessing http://docs.python.org/library/multiprocessing.html当需要真正的并行性时，这是更安全的选择。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Multithreading

webcrawler

GIL

同时在 python 中运行多个线程 - 这可能吗？的相关文章

使用应用程序脚本将 MS Word 文件（保存在云端硬盘中）转换为 Google 文档

我被某些事情困住了找不到解决办法有没有办法使用文件 url 或 id 将存储在 Google Drive 中的 MS Word 文件转换为 Google 文档我目前有一个电子表格其中包含文件的网址或者也可以使用 python 脚
Python GTK + webkit - 在 gtk.main() 之后插入 JavaScript

我在终端中尝试了这个一切正常但是如果我在脚本内运行这个我无法在 gtk main 之后插入 JavaScript import gtk import webkit w gtk Window b webkit WebView w add
最小二乘法拟合直线 python 代码

我有一个由 X 和 Y 坐标组成的散点图我想使用直线的最小二乘拟合来获得最佳拟合线直线最小二乘拟合是指如果 x 1 y 1 x n y n 是测量数据对则最佳直线是y A Bx 这是我的Python代码 number of poin
组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
信号处理程序有单独的堆栈吗？

信号处理程序是否有单独的堆栈就像每个线程都有单独的堆栈一样这是在 Linux C 环境中来自 Linux 手册页signal 7 http kernel org doc man pages online pages man7 sign
fprintf() 线程安全吗？

我正在为野人就餐问题的某些变量编写一个 C 解决方案现在我创建线程每个线程都将 FILE 获取到同一个调试文件在线程内我正在使用 fprintf 进行一些打印打印的语句不受任何类型的互斥锁等保护我没有在调试文件中观察到任何交错行
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
Selenium 不会在新选项卡中打开新 URL（Python 和 Chrome）

我想使用 Selenium WebDriver 和 Python 在不同的选项卡中打开相当多的 URL 我不确定出了什么问题 driver webdriver Chrome driver get url1 time sleep 5 driv
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
根据列索引重命名 Dataframe 列

是否有内置函数可以按索引重命名 pandas 数据框我以为我知道列标题的名称但事实证明第二列中有一些十六进制字符根据我接收数据的方式我将来可能会在第 2 列中遇到这个问题因此我无法将这些特定的十六进制字符硬编码到 datafram
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
Java/Python 中的快速 IPC/Socket 通信

我的应用程序中需要两个进程 Java 和 Python 进行通信我注意到套接字通信占用了 93 的运行时间为什么通讯这么慢我应该寻找套接字通信的替代方案还是可以使其更快更新我发现了一个简单的修复方法由于某些未知原因缓冲输出流似

随机推荐

在views.py中使用Django模型表单时出现错误

在我的 models py 中 class Alert models Model user models CharField max length 30 blank True a models IntegerField blank True
Chartjs - pointColor 跟随渐变描边的当前颜色

我刚刚使用创建折线图chartjs http www chartjs org 图书馆和我设法用渐变颜色进行描边这里很简单fiddle http jsfiddle net jvmk5o6a 例如我到目前为止所做的事情接下来我需要做的是po
PowerShell 5.1 为什么不同 2016 sp1/sp3 数据库上的相同查询返回不同类型

电源外壳 5 1SQL Server 2016 SP1 和 SP3 如果我运行相同的select top 1在 2 个 SQL Server 2016 数据库一个在 sp3 上另一个在 sp1 上之间查询它们返回不同的类型为什么
将Angular6中的main.js拆分为多个文件

当我构建 main js 时我正在使用 Angular 6 当我们构建这个应用程序时我预计它会变得更大大小约为 8 MB 有没有办法将此文件拆分为多个文件以便加载速度更快有没有办法在需要的时候实现延迟加载 chunk 0 runt
如何将数据文件的第一行视为 gnuplot 中的列标签？

我有一个这样的表 A B C D E F G H I 10 23998 16755 27656 17659 19708 20328 19377 18925 20 37298 33368 53936 41421 44548 40756 409
抽屉开关未按预期工作（图标保持不变）

我正在尝试在我的应用程序中实现 ActionBarDrawerToggle 但无法实现我已经实现在工具栏中显示切换按钮但图标始终相同这是抽屉关闭时切换的图标 https i stack imgur com HTcom png http
SQLAlchemy：按关系中的关系字段排序

在我正在开发的金字塔应用程序中我有以下场景 class Widget Base tablename widgets id Column Integer primary key True name Column String 50 side
当命令的输出更改时如何触发 CMake 重新配置

我希望在命令的输出更改时触发 CMake 配置具体来说我正在考虑尝试在输出时进行 CMake 配置git describe always dirty与上次配置 CMake 时相比发生了变化这个问题大部分可以通过观看来解决HEAD文件并
我可以依赖显示为工具提示的标题属性吗？

我们在网站中编写简单的工具提示已经有一段时间了并且刚刚意识到我们可以通过简单地使用标题属性来完成同样的事情我们有什么理由不应该使用 title 属性作为工具提示吗是否有不支持此功能的浏览器 w3学校 http www w3scho
如何为 Angular 6 项目全局添加自定义 CSS 文件

在 angular json 文件中如果我添加 styles src styles css src utility vendor bootstrap css bootstrap css src utility vendor font aw
Z3 返回型号不可用

如果可能的话我想要对我的代码有第二意见问题的约束条件是 a b c d e f是非零整数 s1 a b c and s2 d e f 是集合 The sum s1 i s2 j for i j 0 2必须是一个完美的正方形我不明白为什
React jest 和 MSAL 获取 BrowserAuthError ：加密

我正在尝试测试一些使用 MSAL 进行身份验证的组件到目前为止我有一个简单的测试测试我的组件是否可以渲染如下所示
C++ 矢量问题 - “LNK2001：无法解析的外部符号私有：静态...”

在有人指责我不考虑预先存在的问题之前我已经查看并意识到这与声明有关但我仍然无法让它工作可能与我使用向量有关经理 h include Flight h ifndef manager h define manager h class M
TYPO3 v6 中的语言切换

切换前端语言并不像预期的那样对我有用到目前为止我所做的在根页面我创建了两种网站语言德语和英语在打字稿模板中我添加了以下设置我发现其中大部分分散在网络上 config tx realurl enable 1 simulateSt
我应该将 html 和 java 文件放在 Apache Wicket 中的同一个包（文件夹）中吗？

我想知道是否有一个 html 文件和 java 文件驻留在不同文件夹中的示例我不建议使用单独的页面目录除非您对资源流的工作方式非常熟悉而我则不然我见过的绝大多数 wicket 项目都将类和 html 文件保存在源目录中我尝试自己将
Elmah 错误记录，我可以只记录一条消息吗？

我刚刚安装了 Elmah https code google com p elmah https code google com p elmah 对于我的 ASP NET 应用程序是否可以在不先创建异常的情况下记录消息 catch Exc
SQL Server 和 Oracle“用户”之间的区别

SQL Server 中的用户与 Oracle 中的用户之间有什么区别吗如果有它们是什么 In Oracle 用户和架构是一回事您可以创建两个具有相同名称属于不同用户的不同表 In SQL Server 模式和用户是不同的东西用户
没有函数参数的可变参数模板

我可以使用可变参数模板而不使用模板参数作为函数参数吗当我使用它们时它会编译 include
是类型名称=名称；在 C++ 中有用过吗？

C 中允许使用以下代码 int a a or Type name name 两者都会导致未初始化的对象自行初始化这通常会导致未定义的行为这样的代码是否需要或合理此类代码是否有用这让我想起了一个老GCC 邮件列表主题 http gcc
同时在 python 中运行多个线程 - 这可能吗？

我正在编写一个小爬虫它应该多次获取 URL 我希望所有线程同时运行我写了一小段代码应该可以做到这一点 import thread from urllib2 import Request urlopen URLError HTTPErro

同时在 python 中运行多个线程 - 这可能吗？

同时在 python 中运行多个线程 - 这可能吗？ 的相关文章

随机推荐

热门标签

同时在 python 中运行多个线程 - 这可能吗？的相关文章