Python 多处理性能

2024-03-31

这应该是我的第三个也是最后一个问题，涉及我尝试提高使用 python 进行的一些统计分析的性能。我的代码有 2 个版本（单核与多处理），我希望通过使用多个核心来获得性能，因为我希望我的代码能够解压/解压相当多的二进制字符串，遗憾的是我注意到使用多个核心实际上会降低性能核心。

我想知道是否有人对我观察到的现象有可能的解释（向下滚动至 4 月 16 日更新以了解更多信息)?

程序的关键部分是函数 numpy_array （+多处理中的解码），代码片段如下（完整代码可通过 Pastebin 访问，如下）：

def numpy_array(data, peaks):
    rt_counter=0
    for x in peaks:
        if rt_counter %(len(peaks)/20) == 0:
            update_progress()
        peak_counter=0
        data_buff=base64.b64decode(x)
        buff_size=len(data_buff)/4
        unpack_format=">%dL" % buff_size
        index=0
        for y in struct.unpack(unpack_format,data_buff):
            buff1=struct.pack("I",y)
            buff2=struct.unpack("f",buff1)[0]
            if (index % 2 == 0):
                data[rt_counter][1][peak_counter][0]=float(buff2)
            else:
                data[rt_counter][1][peak_counter][1]=float(buff2)
                peak_counter+=1
            index+=1
        rt_counter+=1

多处理版本通过一组函数执行此操作，我将在下面显示键 2：

def tonumpyarray(mp_arr):
    return np.frombuffer(mp_arr.get_obj())

def numpy_array(shared_arr,peaks):
    processors=mp.cpu_count()
    with contextlib.closing(mp.Pool(processes=processors,
                                    initializer=pool_init,
                                    initargs=(shared_arr, ))) as pool:
        chunk_size=int(len(peaks)/processors)
        map_parameters=[]
        for i in range(processors):
            counter = i*chunk_size
            chunk=peaks[i*chunk_size:(i+1)*chunk_size]
            map_parameters.append((chunk, counter))
        pool.map(decode,map_parameters)

def decode ((chunk, counter)):
    data=tonumpyarray(shared_arr).view(
        [('f0','<f4'), ('f1','<f4',(250000,2))])
    for x in chunk:
        peak_counter=0
        data_buff=base64.b64decode(x)
        buff_size=len(data_buff)/4
        unpack_format=">%dL" % buff_size
        index=0
        for y in struct.unpack(unpack_format,data_buff):
            buff1=struct.pack("I",y)
            buff2=struct.unpack("f",buff1)[0]
            #with shared_arr.get_lock():
            if (index % 2 == 0):
                data[counter][1][peak_counter][0]=float(buff2)
            else:
                data[counter][1][peak_counter][1]=float(buff2)
                peak_counter+=1
            index+=1
        counter+=1

可以通过这些pastebin链接访问完整的程序代码

Pastebin 单核版本 http://pastebin.com/tSqc7Ntj

Pastebin 多处理版本 http://pastebin.com/FWD2SMWm

我使用包含 239 个时间点和每个时间点约 180k 测量对的文件观察到的性能对于单核而言约为 2.5m，对于多处理而言约为 3.5m。

PS：前两个问题（我第一次尝试并行化）：

Python 多处理 https://stackoverflow.com/q/15966157/1093485
使我的 NumPy 数组跨进程共享 https://stackoverflow.com/q/15976937/1093485

——4月16日——

我一直在使用 cProfile 库分析我的程序（具有cProfile.run('main()')在里面__main__，这表明有 1 个步骤会减慢一切：

ncalls  tottime  percall  cumtime  percall filename:lineno(function)
23   85.859    3.733   85.859    3.733 {method 'acquire' of 'thread.lock' objects}

我在这里不明白的是thread.lock对象用于threading（据我的理解）但不应该在多处理中使用，因为每个核心应该运行一个线程（除了有自己的锁定机制），那么这是如何发生的以及为什么单个调用需要 3.7 秒？

共享数据是一种已知的因同步而导致速度变慢的情况。

您可以在进程之间拆分数据，或者为每个进程提供独立的副本吗？然后，在所有计算完成之前，您的流程不需要同步任何内容。

然后，我让主进程将所有工作处理器的输出加入到一个连贯的集合中。

该方法可能需要额外的 RAM，但现在 RAM 很便宜。

如果你问，我也对每个线程锁获取 3700 毫秒感到困惑。对于这样的特殊调用，OTOH 分析可能会出现错误。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 多处理性能的相关文章

在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
更改 x 轴比例

我使用 Matlab 创建了这个图使用 matplotlib x 轴绘制大数字例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
如何在Python中按AaB而不是ABa顺序对字符串进行排序

我正在尝试对字符串进行排序为 punnetsquare 制作基因型我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
为什么我应该使用 WSGI？

使用 mod python 一段时间了我读了越来越多关于 WSGI 有多好的文章但没有真正理解为什么那么我为什么要切换到它呢有什么好处这很难吗学习曲线值得吗为了用 Python 开发复杂的 Web 应用程序您可能会使用更全面
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
OSX 上的 locale.getlocale() 问题

我需要获取系统区域设置来执行许多操作最终我想使用 gettext 翻译我的应用程序我打算在 Linux 和 OSX 上分发它但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
过度使用委托对性能来说是一个坏主意吗？ [复制]

这个问题在这里已经有答案了考虑以下代码 if IsDebuggingEnabled instance Log GetDetailedDebugInfo GetDetailedDebugInfo 可能是一个昂贵的方法因此我们只想在调试模式
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
使用Multiprocessing和Pool时如何访问全局变量？

我试图避免将变量冗余地传递到dataList e g 1 globalDict 2 globalDict 3 globalDict 并在全球范围内使用它们 global globalDict然而在下面的代码中并不是这样做的解决方案是否有

随机推荐

申请账户信息不正确

验证应用程序时出现此错误重新启动 Xcode 和 Mac 机器后苹果修复了导致问题的任何原因问题似乎已经解决在 OS 10 9 5 上通过 iTunes Producer 3 1 成功交付包
hql 中分区的 row_number()

hql 中分区上的 row number 相当于什么我在 hql 中有以下查询 select s Companyname p Productname sum od Unitprice od Quantity od Discount as
恢复到 nvm 默认版本

每当我使用 cd 时我总是得到 Reverting to nvm default version N A version default gt N A is not yet installed You need to run nvm in
使用 Bash 脚本进行日志轮换

我有以下问题我有一个应用程序它不断地向 stderr 和 stdout 生成输出该应用程序的输出被捕获在日志文件中该应用程序被重定向为 gt log txt 我没有任何选项来为此生成适当的日志记录现在我有一个 cron 作业它
音频处理和删除音频的某些部分

我是语音编码新手现在我成功地在文件中录制麦克风并将每 10 秒保存在一个文件中SaveRecordtoFile功能这样做没有问题现在我想从记录的数据中删除例如 2 秒这样我的输出将是 8 秒而不是 10 秒在randomTime
如何获取当前运行的hadoop作业的名称？

我需要获取当前正在运行的作业名称列表但是hadoop job list给我一份 jobID 列表有没有办法获取正在运行的作业的名称有没有办法从 jobID 中获取作业名称我不得不多次执行此操作因此我想出了以下命令行您可以将其放入
如何从 Entity Framework 4.3 代码优先模型生成 DDL 脚本？

我有一个正在尝试部署的项目并且我正在使用廉价的主机来开始作为托管包的一部分我有一个 SQL Server 数据库但我没有删除或创建权限我只能使用他们为我创建的数据库既然如此我想获取 DDL 以便我可以手动运行它我知道我可以从
如何使用 JavaScript 函数式编程从对象列表中找到具有最低属性的对象？

老方法 let min Number MAX VALUE for let item of food let current Problem manhattan distance player item if current gt min m
Webpacker/Typescript 无法解析 Rails 资产管道文件

我正在尝试导入 Rails 资产管道中的文件但由于某种原因 webpack 找不到它这是我的 tsconfig json compilerOptions declaration false emitDecoratorMetadata t
使用Spring Data JPA调用存储过程时如何传入数组

我正在关注这个example https dzone com articles calling stored procedures from spring data jpa使用 Spring Data JPA 调用存储过程这个想法是创建一
setNavigationItemSelectedListener 不工作

My NavigationView onClick活动不起作用以下是我一一尝试过的代码片段但没有任何效果实施NavigationView OnNavigationItemSelectedListener using OnClick M
Angular Ivy 在手动变更检测方面具体允许我们做什么？

本文 https blog ninja squad com 2019 05 07 what is angular ivy 提到不过常春藤为未来开启了一些可能性现在应该可以在没有 zone js 的情况下运行应用程序并半手动处理更改检
列表子列表优化

问题是从给定列表中查找不包含大于指定上限数字的子列表总数right并且子列表的最大数量应该大于下限left假设我的清单是 x 2 0 11 3 0 子列表元素的上限是10下界是1那么我的子列表可以是 2 2 0 3 3 0 因为子列表始终是
Interlocked.Exchange 可空小数

我想交换两个可为空的十进制值如下所示 o2 Interlocked Exchange ref o1 o2 类型十进制必须是引用类型才能将其用作泛型类型或方法 System Threading Interlocked Exchange
尝试在单独的实例中打开工作簿

不确定我做得是否正确请建议我我正在尝试在新实例中打开一本工作簿但有些地方效果不太好下面是代码供您参考我正在尝试在新实例中打开名为 Loginfrm 的表单假设如果另一个工作簿已打开则当前代码也会冻结该工作簿理想情况下这不应
添加/删除程序中的 Wix 图标

我正在使用 Wix 来创建我的安装程序据官方称文档 http wixtoolset org documentation manual v3 howtos ui and localization configure arp appearan
访问路径被拒绝 (Xamarin/Android)

我运行的是 Windows 10 Visual Studio 2015 和 Xamarin 我对 Xamarin 相当陌生只是为了设置地面水平我最近更新后遇到了一个问题我的应用程序在更新之前可以正常运行我的所有文件都是只读的更新之
尝试使用 Jersey 创建 REt 服务

我正在关注this http www vogella com articles REST article html first使用 Jersey 创建 REt 服务的教程有时我无法完全理解本教程作者的意思但这些是我到目前为止所遵循的步骤
lit-element 将数据从一个组件传递到另一个组件

我目前正在学习如何使用 lit element v2 0 0 rc 2 我有两个组件 app js 和 list items js 在 app js 中我从本地存储收集数据并将其存储在 this todoList 中然后我在 list
Python 多处理性能

这应该是我的第三个也是最后一个问题涉及我尝试提高使用 python 进行的一些统计分析的性能我的代码有 2 个版本单核与多处理我希望通过使用多个核心来获得性能因为我希望我的代码能够解压解压相当多的二进制字符串遗憾的是我注意到使

Python 多处理性能

Python 多处理性能 的相关文章

随机推荐

热门标签

Python 多处理性能的相关文章