多进程 vs 多线程 Python 耗时

2024-03-05

我有 2 个简单的函数（在一定范围内循环），可以单独运行而无需任何依赖。我正在尝试使用 Python 多处理模块和多线程模块来运行这两个函数。

当我比较输出时，我发现多进程应用程序比多线程模块多花费 1 秒。

我读到，由于全局解释器锁，多线程效率不高......

基于以上陈述——
1. 如果两个进程之间没有依赖关系，最好使用多处理吗？
2. 如何计算我的机器中可以运行的进程/线程的数量以获得最大效率。
3.还有，有没有办法通过使用多线程来计算程序的效率...

多线程模块...

from multiprocessing import Process

import thread
import platform

import os
import time
import threading
class Thread1(threading.Thread):
    def __init__(self,threadindicator):
        threading.Thread.__init__(self)
        self.threadind = threadindicator

    def run(self):
        starttime = time.time() 
        if self.threadind == 'A':
            process1()
        else:
            process2()
        endtime = time.time()
        print 'Thread 1 complete : Time Taken = ', endtime - starttime

def process1():
    starttime = time.time() 
    for i in range(100000):
        for j in range(10000):
            pass        
    endtime = time.time() 

def process2():
    for i in range(1000):
        for j in range(1000):
            pass

def main():

    print 'Main Thread'
    starttime = time.time()
    thread1 = Thread1('A')
    thread2 = Thread1('B')
    thread1.start()
    thread2.start()
    threads = []
    threads.append(thread1)
    threads.append(thread2)

    for t in threads:
        t.join()
    endtime = time.time()
    print 'Main Thread Complete , Total Time Taken = ', endtime - starttime


if __name__ == '__main__':
    main()

多进程模块

from multiprocessing import Process
import platform

import os
import time

def process1():
#     print 'process_1 processor =',platform.processor()
    starttime = time.time() 
    for i in range(100000):
        for j in range(10000):
            pass
    endtime = time.time()
    print 'Process 1 complete : Time Taken = ', endtime - starttime 


def process2():
#     print 'process_2 processor =',platform.processor()
    starttime = time.time()
    for i in range(1000):
        for j in range(1000):
            pass
    endtime = time.time()
    print 'Process 2 complete : Time Taken = ', endtime - starttime

def main():
    print 'Main Process start'
    starttime = time.time()
    processlist = []

    p1 = Process(target=process1)
    p1.start()
    processlist.append(p1)

    p2 = Process(target = process2)
    p2.start()
    processlist.append(p2)

    for i in processlist:
        i.join()
    endtime = time.time()
    print 'Main Process Complete - Total time taken = ', endtime - starttime

if __name__ == '__main__':
    main()

如果你的机器上有两个可用的CPU，有两个不需要通信的进程，并且你想同时使用它们来使你的程序更快，你应该使用多处理模块，而不是线程模块。

全局解释器锁 (GIL) 阻止 Python 解释器通过使用多个线程来有效利用多个 CPU，因为一次只能有一个线程执行 Python 字节码。因此，多线程不会改善应用程序的整体运行时间，除非您有阻塞的调用（例如等待 IO）或释放 GIL（例如numpy将对某些昂贵的呼叫执行此操作）较长时间。然而，多处理库创建了单独的子进程，因此创建了多个解释器副本，因此它可以有效地利用多个 CPU。

但是，在您给出的示例中，一个进程完成得非常快（在我的计算机上不到 0.1 秒），而另一个进程则需要大约 18 秒才能完成。确切的数字可能会有所不同，具体取决于您的硬件。在这种情况下，几乎所有工作都在一个进程中进行，因此无论如何，您实际上只使用一个 CPU。在这种情况下，生成进程与线程的开销增加可能会导致基于进程的版本变慢。

如果您让两个进程都执行 18 秒的嵌套循环，您应该会看到多处理代码运行得更快（假设您的机器实际上有多个 CPU）。在我的机器上，我看到多处理代码在大约 18.5 秒内完成，多线程代码在 71.5 秒内完成。我不确定为什么多线程花费的时间超过大约 36 秒，但我的猜测是 GIL 导致了某种线程争用问题，从而减慢了两个线程的执行速度。

至于你的第二个问题，假设系统上没有其他负载，你应该使用等于系统上 CPU 数量的进程数。你可以通过这样做发现这一点lscpu在Linux系统上，sysctl hw.ncpu在 Mac 系统上，或运行dxdiag从 Windows 上的“运行”对话框（可能还有其他方法，但我总是这样做）。

对于第三个问题，计算从额外进程中获得多少效率的最简单方法就是测量程序的总运行时间，使用time.time()像你一样，或者timeLinux 中的实用程序（例如time python myprog.py）。理想的加速比应该等于您使用的进程数，因此在 4 个 CPU 上运行的 4 进程程序应该是at most假设您从额外的进程中获得最大收益，则比具有 1 个进程的相同程序快 4 倍。如果其他进程对您的帮助不大，那么效率将低于 4 倍。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

multiprocessing

多进程 vs 多线程 Python 耗时的相关文章

如何在 Python 中使这个随机文本生成器更加高效？

我正在研究一个随机文本生成器不使用马尔可夫链目前它的工作没有太多问题首先这是我的代码流程输入一个句子作为输入这称为触发字符串被分配给一个变量获取触发字符串中最长的单词在所有古腾堡计划数据库中搜索包含该单词的句子无论大写还
使用 pycharm 进行交互式 shell 调试

我是 PyCharm 新手我已经使用 IDLE 很长时间了在IDLE中执行脚本后使用Python对象非常方便有没有办法在使用 PyCharm 与交互式 python shell 执行后使用脚本对象例如我们有一个测试项目其中包
在 Python 中静默打印 PDF

我正在尝试使用 Python 打印 PDF 而不打开 PDF 查看器应用程序 Adobe Foxit 等我还需要知道打印何时完成以删除文件 Here http permalink gmane org gmane comp python
ValueError：无法将 DatetimeIndex 转换为 dtype datetime64[us]

我正在尝试为 S P 500 ETF 创建一个包含 30 分钟数据的 PostgreSQL 表 spy30new 用于测试新插入的数据来自具有 15 分钟数据的多个股票的表全部 15 个 all15 在 dt 时间戳和 instr 股
使用 python 将 bibtex 文件转换为 html （也许是 pybtex？）

您好我想解析 bibtex 出版物文件并对特定字段例如年份进行排序并过滤某些内容然后将其放在网站上我遇到了 pybtex 它可以读取和解析 bibtex 文件但它基本上没有记录我不知道如何对条目进行排序 pybtex 是可行的
Dataframe unstack 性能 - pandas

我正在尝试拆开数据框它工作正常但问题是我正在处理 CSV 文件中的巨大数据集约 10 亿这是示例数据集 236539 48512569874 Name Danny 236539 48512569874 Class 12 236539
函数内部变量的赋值会改变外部的赋值 - Python

我从使用 Matlab 转向使用 Python 使用函数时的变量赋值让我感到困惑我有一个代码如下 a 1 1 1 def keeps x y x y 1 2 return y def changes x y x y 1 2 return
如何使用httplib2进行相互证书认证

我正在使用 httplib2 从我的服务器向另一个 Web 服务发出请求我们想要使用相互证书身份验证我了解如何使用证书进行传出连接 h set certificate 但是如何检查应答服务器使用的证书这张票 http code goo
使用Python构建caffe（找不到-lboost_python3）

我正在尝试用 python 构建 caffe 但它一直这样说 CXX LD o python caffe caffe so python caffe caffe cpp usr bin ld cannot find lboost pytho
在keras自定义损失中使用层输出

我正在 Keras 中开发自定义损失函数我需要第一层输出我怎样才能取回它 def custom loss y true y pred cross K mean K binary crossentropy y true y pred ax
为什么Python安装程序不断弹出？

每当我尝试运行 Python 文件时都会自动弹出此窗口虽然我可以关闭它但有时它会连续打开 7 10 个窗口这令人恼火谁能告诉我为什么会发生这种情况 None
Python UPnP/IGD 客户端实现？

我正在寻找一个开源实现UPnP http elinux org UPnPPython 中的客户端更具体地说是它的互联网网关设备 http en wikipedia org wiki Internet Gateway Device Prot
将 scipy 稀疏矩阵的几行采样到另一个中

如何对 scipy 稀疏矩阵的某些行进行采样并从这些采样的行中形成一个新的 scipy 稀疏矩阵例如如果我有一个 10 行的 scipy 稀疏矩阵 A 并且我想创建一个新的 scipy 稀疏矩阵 B 其中 A 的第 1 3 4 行该
如何使用Python3.4在tornado中进行异步mysql操作？

我现在使用Python3 4 我想在Tornado中使用异步mysql客户端我已经发现torndb https github com bdarnell torndb但在阅读其源代码后我认为它无法进行异步mysql操作因为它只是封装了M
从由空格分隔的单个输入整数列表创建二维数组

我正在解决一些问题geeksforgeeks我遇到了一个特定的问题其中在测试用例中提供了输入如下所示 2 2 denotes row column of the matrix 1 0 0 0 all the elements of th
使用 Python 3.x 基本获取 URL 的 HTML 正文

我是Python新手我对 Python 2 x 中的旧 urllib 和 urllib2 与 Python 3 中的新 urllib 之间的差异有点困惑除此之外我不确定数据在发送到 urlopen 之前何时需要编码我一直在尝试使用
加入语音频道（discord.py）

当我尝试让我的机器人加入我的语音频道时出现以下错误 await client join voice channel voice channel 产生错误的行 Traceback most recent call last File usr
Python 单元测试：Nose 失败时重试？

我有一个随机失败的测试我想让它在发送错误消息之前重试多次我将 python 与 Nose 一起使用我写了以下内容但不幸的是即使使用 try except 处理当第一次尝试测试失败时 Nose 也会返回错误 def test so
Python google云函数部署失败-Madmom pip包

我正在尝试使用 madmom python pip 包部署 Python3 7 Google Cloud Function 但是指定madmom 0 16 1requirements txt 中的内容导致部署失败当我从requiremen
加载腌制字典对象或加载 JSON 文件哪个更快？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案什么更快 A Unpickling 加载一个 pickled 字典对象使用pickle load or B 使用以下命令将 JSON

随机推荐

无法在 ios5 的connectionDidFinishDownloading 中获取destinationURL 数据

我正在尝试获取要下载的资产网址列表我使用 NSURLConnection 来获取包含此 url 列表的 JSON 文件在 void connection NSURLConnection connection didWriteData l
Docker 容器无法解析 DNS 来访问另一台 AWS Ec2 机器

我无法通过从主机 App1 上运行的容器解析 DNS 来 ping 另一台计算机主机 App2 尽管 etc resolv conf 与主机的相同我正在利用 AWS Route 53 私有托管 DNS 来允许通过解析 DNS 而不是 I
React/Redux，如何获取用户输入

我正在关注与 React 一起使用 http redux js org docs basics UsageWithReact html终极版教程我真正不明白的是如何检索用户输入他们构建了一个FilterLink容器其mapDispat
Axios 通过 Django REST Framework 被 CORS 策略阻止

我正在尝试使用 Axios 向我的 API Django REST Framework 发出请求但出现以下错误 Access to XMLHttpRequest at http trvl hopto org 8000 api airpor
复制文件时 Homebrew 安装失败

我运行这个 usr bin ruby e curl fsSL https raw githubusercontent com Homebrew install master install 我得到提示 gt This script will
在 netbeans 8.0 中添加 Java ME 平台

我在安装 Netbeans 8 0 的 ME 平台时遇到问题我有安装 Netbeans IDE 8 0 安装jmesdk 3 4 安装 jmesdk 3 4 插件并在 Netbeans 中激活它当我尝试创建新的 Java ME gt
如何在javafx中显示图像的特定部分

我有这张图片所有这些效果都在一个 png 文件中我想显示例如第二张图片如何在 javafx 中使用 Image 和 ImageView 来显示该图像的特定部分谢谢这个答案太过分了但是有了像您问题中那样的一组漂亮的图像也许需要
正则表达式.匹配整个单词

In C 我想使用正则表达式来匹配以下任何单词 string keywords shoes shirt pants 我想找到内容字符串中的整个单词我以为这个regex会这样做 if Regex Match content keywords
java中如何将二进制字符串转换为2个字节的字节数组

我有二进制字符串String A 1000000110101110 我想把这个字符串转换成长度为2的字节数组java 我已经得到了帮助this https stackoverflow com questions 17727310 conve
两个 div 元素，一个在中间，另一个在右边

我想将一个 div 元素放置在宽度约为 1000px 的页面中央另一个元素位于其右侧覆盖整个右侧可以根据窗口大小进行调整实际上我在居中的 div 上有一个右浮动元素所以绝对定位可以完成这项工作但在放大页面时可以看到其中的缺陷
NSTask waitUntilExit 在越狱 iOS 上挂起应用程序

所以我让 NSTask 运行一个脚本该脚本生成一个列表并将其放入我读取的 txt 中但是如果我使用当前的代码如下则会在 NSTask 完成之前弹出警报从而导致空白警报我试过了waitUntilExit但这会使调用此操作的按钮
在固定宽度

多进程 vs 多线程 Python 耗时

多进程 vs 多线程 Python 耗时 的相关文章

随机推荐

多进程 vs 多线程 Python 耗时的相关文章