Python 线程并没有提高速度

2023-12-13

为了加速某个列表处理逻辑，我编写了一个装饰器，它会 1) 拦截传入的函数调用 2) 获取其输入列表，将其分成多个部分 4) 将这些部分传递给单独线程上的原始函数 5) 组合输出和返回

我认为这是一个非常巧妙的想法，直到我对其进行编码并发现速度没有变化！尽管我看到 htop 上有多个核心忙碌，但多线程版本实际上比单线程版本慢。

这与臭名昭著的 cpython GIL 有关吗？

Thanks!

from threading import Thread 
import numpy as np 
import time

# breaks a list into n list of lists
def split(a, n):
    k, m = len(a) / n, len(a) % n
    return (a[i * k + min(i, m):(i + 1) * k + min(i + 1, m)] for i in xrange(n))

THREAD_NUM = 8 

def parallel_compute(fn):
    class Worker(Thread):
        def __init__(self, *args):
            Thread.__init__(self)
            self.result = None
            self.args = args
        def run(self):
            self.result = fn(*self.args)
    def new_compute(*args, **kwargs):        
        threads = [Worker(args[0], args[1], args[2], x) for x in split(args[3], THREAD_NUM)]
        for x in threads: x.start()
        for x in threads: x.join()
        final_res = []
        for x in threads: final_res.extend(x.result)
        return final_res        
    return new_compute

# some function that does a lot of computation
def f(x): return np.abs(np.tan(np.cos(np.sqrt(x**2))))

class Foo:
    @parallel_compute
    def compute(self, bla, blah, input_list):
        return map(f, input_list)

inp = [i for i in range(40*1000*100)]
#inp = [1,2,3,4,5,6,7]

if __name__ == "__main__": 

    o = Foo()
    start = time.time()
    res = o.compute(None, None, inp)
    end = time.time()
    print 'parallel', end - start

单线程版本

import time, fast_one, numpy as np

class SlowFoo:
    def compute(self, bla, blah, input_list):
        return map(fast_one.f, input_list)

if __name__ == "__main__": 

    o = SlowFoo()
    start = time.time()
    res = np.array(o.compute(None, None, fast_one.inp))
    end = time.time()
    print 'single', end - start

这是多处理版本"PicklingError: Can't pickle <type 'function'>: attribute lookup __builtin__.function failed".

import pathos.multiprocessing as mp
import numpy as np, dill
import time

def split(a, n):
    k, m = len(a) / n, len(a) % n
    return (a[i * k + min(i, m):(i + 1) * k + min(i + 1, m)] for i in xrange(n))

def f(x): return np.abs(np.tan(np.cos(np.sqrt(x**2))))

def compute(input_list):
    return map(f, input_list)

D = 2; pool = mp.Pool(D)
def parallel_compute(fn):
    def new_compute(*args, **kwargs):
        inp = []
        for x in split(args[0], D): inp.append(x)
        outputs_async = pool.map_async(fn, inp)
        outputs = outputs_async.get()
        outputs = [y for x in outputs for y in x]
        return outputs
    return new_compute

compute = parallel_compute(compute)

inp = [i for i in range(40*1000)]

if __name__ == "__main__": 

    start = time.time()
    res = compute(inp)
    end = time.time()
    print 'parallel', end - start
    print len(res)

是的，当你的线程正在执行用 Python 实现的 CPU 密集型工作时（不是通过 C 扩展来实现的，C 扩展可以在从 Python 结构中编组/解组数据之前和之后释放 GIL），GIL 就是一个问题。

我建议使用多处理模型、没有它的 Python 实现（IronPython、Jython 等）或完全不同的语言（如果您正在做性能敏感的工作，那么语言是没有止境的）nearly与 Python 一样流畅，但运行时性能要好得多）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 线程并没有提高速度的相关文章

pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
ca 证书 Mac OS X

我需要在emacs 上安装offlineimap 和mu4e 问题是配置当我运行 Offlineimap 时我得到 OfflineIMAP 6 5 5 Licensed under the GNU GPL v2 v2 or any la
如何在 Google App Engine 的 Python 中获取 StringProperty 的值？

如何获取 nbd Model 的值我想返回由多个字段组成的描述但我无法让它工作这是我的班级代码 class User ndb Model name ndb StringProperty email ndb StringProperty
正则表达式，选择最接近的匹配

假设以下单词序列 BLA text text text text text text BLA text text text text LOOK text text text BLA text text BLA 我想做的是将 BLA 中的文本
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
Tipfy：如何在模板中显示blob？

鉴于在 gae 上使用tipfy http www tipfy org python 以下模型 greeting avatar db Blob avatar 显示 blob 此处为图像的模板标签是什么在这种情况下斑点是一个图像这很棒
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
Python——捕获异常的效率[重复]

这个问题在这里已经有答案了可能的重复 Python 常见问题解答异常有多快 https stackoverflow com questions 8107695 python faq how fast are exceptions 我记得
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
终结器线程的范围是什么 - 每个应用程序域或每个进程？

根据我的所有阅读应该有一个 GC 线程来调用所有终结器现在的问题是这个一个线程的范围是什么每个进程或每个应用程序域因为域的整体目的是在一个进程空间中分离并创建独立的不同应用程序 I read here http dn cod
如何从 nltk 下载器中删除数据/模型？

我在 python3 NLTK 中安装了一些 NLTK 包通过nltk download 尝试过它们但不需要它们现在想删除它们我怎样才能删除例如包large grammars来自我的 NLTK 安装我不想删除完整的 NLTK 安装
在python中对列表列表执行行总和和列总和

我想用python计算矩阵的行和和列和但是由于信息安全要求我无法使用任何外部库因此为了创建矩阵我使用了列表列表如下所示 matrix 0 for x in range 5 for y in range 5 for pos in

随机推荐

无法通过 Kendo UI 图表上的 xpath 定位 SVG 元素

我确实尝试了一些 xpath 但似乎运气不佳我想点击国家然后点击图表给出下面的屏幕截图网站网址是 https demos telerik com kendo ui bar charts column 我尝试了xpath text t
迭代 PriorityQueue 不会产生有序结果

import java util class Priority public static void main String args PriorityQueue
python正则表达式中的匹配括号[重复]

这个问题在这里已经有答案了我有类似的东西 store s 结束行就像 1 家商店我想使用Python正则表达式来匹配它我尝试过类似的东西re match store s text 但它不起作用这是我尝试过的代码 import re
Jenkins - 构建步骤之间的条件

我想使用 Jenkins 构建一个 Maven 项目但是只有当 SVN 存储库中的某个文件发生更改并且包含特殊密钥时才必须构建项目所以我的计划是创建一个包含两个构建步骤的作业第一步执行一个 shell 或 python 脚本来检
Delphi非可视化TTree实现

我正在寻找一种非可视持久树 TStringTree 实现如果有人知道它的任何良好实施请告诉我 Thanks 你会发现一个灵活的非可视化的树结构DI 容器图书馆商业然而正如其他人上面所指出的开发自己的功能确实非常容易只需添加您
/proc 的内核模块

如何编写一个内核模块在 proc 中创建一个名为 mymod 的目录并在其中创建一个名为 mymodfile 的文件该文件在写入时应接受 1 到 3 范围内的数字并在读取时根据已写入的数字返回以下消息 1 当前系统时间以微秒精度为
RenderScript 源代码在哪里

我正在大学项目中研究 RenderScript 我们想要找到选择 RenderScript 代码运行位置的调度程序在 CPU 上 GPU DSP 并研究它如何做出这种选择问题是我们找不到与调度程序相关的任何源代码事实上我们在源代码
在 Swift 中修改字典数组

我是 Swift 新手在理解数组和字典的某些方面遇到了一些麻烦我有一个字典数组我使用了类型别名例如 typealias myDicts Dictionary
无服务器框架 v1 - 一个服务中的多个资源

我有两个资源游戏和玩家都有crud功能这些应该位于同一个无服务器服务中吗我想将它们分开但是如何将它们放在同一个 api 网关中无服务器框架项目部署单个 API 网关因此如果您希望它位于不同的 API 网关中您需要单独的无服
获取 Internet Explorer 选项卡标题

我正在尝试获取所有打开的 IE 选项卡标题的列表或搜索特定的选项卡标题我一直在使用它但由于某种原因并不适用于每个选项卡 Get a handle to an application window DllImport USER32 DLL
删除数组中的重复项

我编写了一个程序来删除数组中的重复项但该程序的 if 条件始终保持为 true 我明白问题所在将 arr i 更改为 arr count 并通过 malloc 分配内存但程序按原样打印数组而不删除重复项 include
MFC 对话框资源可以附加到 CChildView 吗？

我有一个单文档 MFC 应用程序其中包含MainFrame 源自 CFrameWnd 并包含在其中CChildView 派生形式CWnd 这些是由 VS MFC 向导生成的在资源编辑器中我设计了一个简单的 UI 并将其标记为IDD C
jQuery 点击事件返回 false

我的点击事件设置如下 dialogLink click function dialog this return false 都有一个 return false 有人可以解释一下它的作用以及是否需要吗你什么时候回来false从事件处理程序中
403 Forbidden（错误代码：50001）：添加角色时缺少访问权限 |不和谐.py

我正在尝试快速为人们分配不同的角色以便给用户留下他们的名字是 Rainbow 的印象是的我知道这违反了 TOS 并且我首先在删除角色之前为人们添加角色但是在添加角色时我在这篇文章的标题中收到错误我已经研究过这个问题并尝试了很多
在 NumPy 数组的每个单元格高效评估函数

给定 NumPy 数组A 最快最有效的应用方法是什么same功能f to every cell 我分配给A i j by f A i j 功能f 没有二进制输出因此屏蔽操作无济于事每个单元格的双循环迭代是最佳解决方案吗你可以只是矢量
Android凌空上传图片

我跟着本教程将图像上传到我的服务器但是一旦我单击图库中的一张图片它就会关闭我的应用程序我有两个按钮一个用于浏览另一个用于用户做出选择后上传要浏览我这样做 private void showFileChooser Intent
对 URL 字符串中的 ID 进行加密/编码

只是想在我的网站上做一些安全工作并尝试找出确保 ID 安全的最佳途径例子 http localhost page php id 90 TO http localhost share 22349234987sdsdf9sdf8742349
PDF 文件的 CUPS 打印

我怎样才能告诉lpr命令 CUPS 我的文件实际上是 PDF lpr file pdf 不会打印任何东西这真的是基于 CUPS 的吗 lpr 还是安装 CUPS 之前未删除的另一个假脱机系统的残余通过运行来检查ldd which lpr
Microsoft graph API：通过 iCalUid 查找事件

我想拒绝一次定期会议我只有 masterSerieId iCalId 该实例的时间你知道我如何取消该实例吗我是否必须使用实例的 masterId 和时间进行查询才能查找事件 id 还是有一种方法可以使用 iCalId 查找 event
Python 线程并没有提高速度

为了加速某个列表处理逻辑我编写了一个装饰器它会 1 拦截传入的函数调用 2 获取其输入列表将其分成多个部分 4 将这些部分传递给单独线程上的原始函数 5 组合输出和返回我认为这是一个非常巧妙的想法直到我对其进行编码并发现速度没有变

Python 线程并没有提高速度

Python 线程并没有提高速度 的相关文章

随机推荐

热门标签

Python 线程并没有提高速度的相关文章