Python 并行计算 - Scoop

2024-01-10

我正在尝试熟悉 Scoop 库（此处的文档：https://media.readthedocs.org/pdf/scoop/0.7/scoop.pdf https://media.readthedocs.org/pdf/scoop/0.7/scoop.pdf）学习如何并行执行统计计算，特别是使用 futures.map 函数。

因此，首先，我想尝试运行一个简单的线性回归，并使用从正态分布随机生成的 10000000 个数据点（4 个特征，1 个目标变量）来评估串行计算和并行计算之间的性能差异。

这是我的代码：

import pandas as pd
import numpy as np
import random
from scoop import futures
import statsmodels.api as sm
from time import time

def linreg(vals):
    global model
    model = sm.OLS(y_vals,X_vals).fit()
    return model
    print(model.summary())    

if __name__ == '__main__':

    random.seed(42)
    vals = pd.DataFrame(np.random.normal(loc = 3, scale = 100, size =(10000000,5)))
    vals.columns = ['dep', 'ind1', 'ind2', 'ind3', 'ind4']
    y_vals = vals['dep']
    X_vals = vals[['ind1', 'ind2', 'ind3', 'ind4']]

    bt = time()
    model_vals = list(map(linreg, [1,2,3]))
    mval = model_vals[0]
    print(mval.summary())
    serial_time = time() - bt

    bt1 = time()
    model_vals_1 = list(futures.map(linreg, [1,2,3]))
    mval_1 = model_vals_1[0]
    print(mval_1.summary())
    parallel_time = time() - bt1

    print(serial_time, parallel_time)

然而，之后回归摘要确实是通过 Python 的标准映射函数串行生成的，出现错误：

回溯（最近一次调用最后一次）：文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\runpy.py”，第 193 行，在 _run_module_as_main 中 ”main“，mod_spec）文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\runpy.py”，第 85 行，在 _run_code 中执行（代码，run_globals）文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\bootstrap__main__.py”，第 302 行，位于 b.main() 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\bootstrap__main__.py”，第 92 行，在 main 中自我运行（）文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\bootstrap__main__.py”，第 290 行，运行中 futures_startup() 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\bootstrap__main__.py”，第 271 行，在 futures_startup 中运行名称=“main” 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\futures.py”，第 64 行，在 _startup 中结果 = _controller.switch(rootFuture, *args, **kargs) 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop_control.py”，第 253 行，在 runController 中引发 future.ExceptionValue 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop_control.py”，第 127 行，在 runFuture 中 future.resultValue = future.callable(*future.args, **future.kargs) 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\runpy.py”，第 263 行，在 run_path 中 pkg_name=pkg_name, script_name=fname) 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\runpy.py”，第 96 行，在 _run_module_code 中 mod_name、mod_spec、pkg_name、script_name）文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\runpy.py”，第 85 行，在 _run_code 中执行（代码，run_globals）文件“Scoop_map_线性_regression1.py”，第 33 行，位于 model_vals_1 = list(futures.map(linreg, [1,2,3])) 文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\futures.py”，第 102 行，在 _mapGenerator 中对于 _waitAll(*futures) 中的未来：文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\futures.py”，第 358 行，在 _waitAll 中对于 _waitAny(future) 中的 f：文件“C:\Users\niccolo.gentile\AppData\Local\Continuum\anaconda3\envs\tensorenviron\lib\site-packages\scoop\futures.py”，第 335 行，在 _waitAny 中引发 childFuture.ExceptionValue NameError：名称“y_vals”未定义

之后产生。这意味着代码停止于model_vals_1 = list(futures.map(linreg, [1,2,3])).

我也尝试使用地图运行它两次，并且确实没有出现错误。

我还指定该脚本已正确启动：

python -m scoop Scoop_map_linear_regression1.py

从 Anaconda Prompt 命令行。

事实上，如果在没有 -m scoop 参数的情况下启动它，它不会并行化并且实际上会运行，而只是使用 Python 内置映射函数的两倍，就像在警告中报告的那样。也就是说，如果启动时不指定 -m scoop 参数，futures.map 将被 map 替换。

我的目标是使用 futures.map 并行运行它，并评估性能改进。

指定它以避免任何其他类似的答案并因此被搁置。

任何评论都受到高度赞赏和欢迎。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 并行计算 - Scoop 的相关文章

从父类返回子类

我有一个构建器类它从大多数方法返回自身以允许菊花链为了使此功能适用于子类我希望父方法返回子类的实例以便子方法可以链接到末尾 public class BaseBuilder
Firestore 未检索完整的数据值

图 1 显示了我的数据库的层次结构我正在尝试检索课程名称 Android 品牌斜体数据品牌其他由后端 post 命令添加其他数据通过打字添加当只检索非斜体数据时如屏幕截图 2 所示我无法弄清楚为什么会发生这种情况屏幕截图
在实体框架中对连接字符串进行硬编码

我知道很多人认为对连接信息进行硬编码是一个坏主意但我有一个特定的情况需要这样做请不要贬低我因为你认为这是一个坏主意再次非常具体的情况使用下面的代码我在 LINQ 语句上收到以下错误底层提供程序在打开时失败我已经独立测试了连
如何从 typescript 使用 npm 模块？

我正在尝试打字稿它在 hello world 阶段运行良好我现在尝试使用 npm 模块 index ts import require lodash console log toUpper Hello world 这不起作用 tsc i
在 C# 中将字符串转换为等效的字节十六进制

我有一个传入的字符串68016101061B4A60193390662046804020422044204000420040402060226024676DB16我想转换成0x68 0x01 0x61 0x01 0x06 0x1B 0x4A
Xamarin.Forms：如何访问 ListView.GroupHeaderTemplate 中 ListView.ItemTemplate 中使用的集合？

我需要访问 ListView GroupHeaderTemplate 中 Switch 中的 OnOff 属性该属性位于 ListView ItemTemplate 使用的集合中我尝试了很多方法但没有成功有人遇到过这个问题吗 gt
在 Qt 服务器上验证用户身份

我正在尝试使用 C QtTcpSocket 为个人项目多人国际象棋游戏实现身份验证系统我的朋友建议了一种验证用户的方法但我想问是否有更简单或更好的方法来自 Python 背景做这个项目主要是为了加深对 C 的理解我将发布我朋友
“多对二”关系

我想知道多对二关系孩子可以与两个父母中的任何一个有联系但不能与两个父母都有联系有什么办法可以加强这一点吗另外我想防止孩子重复输入现实世界的例子是电话号码用户和公司一个公司可以有很多电话号码一个用户可以有很多电话号码但理
List 中的 TextView 被截断

我有一个自定义 ListView 其中有一个图像视图和两个位于图像视图旁边的 TextView 底部的文本视图包含标题的描述但它被列表切断了 http tinypic com r 28tawrc 7 http tinypic com r
如何将 JavaScript 库包含到 Spring MVC 项目中（例如 jQuery 或 Dojo）

我在这里阅读了超过 5 个相关主题但无法找到答案分步说明到目前为止我已经有了 STS Spring MVC 模板结构并尝试将jquery js在我的项目中的某个地方不幸的是没有人说它应该在哪里那么请说将 jquery js
应用程序操作通过应用程序操作工具插件工作，但不能在 Google Assistant 屏幕中使用语音命令

使用相同的凭据 Android Studio Google Console 真实设备 Samsung s10 登录并将设备语言设置为 EN US 从工具菜单中选择应用程序操作工具插件将调用名称 todo 应用程序和区域设置提供给 En
反应式表单中使用的自定义组件 MdDatePicker

我正在尝试创建一个要在角度 formGroup 中使用的自定义组件以下是我想要使用此自定义组件的方式
String.将 CRLF 替换为 '\n'

我想知道是否有一种方法可以用 n 替换所有 CRLF 实例有办法实现吗你尝试过哪些方法不起作用回车换行的意思回车 http en wikipedia org wiki Carriage return 换行 http en wikipe
如何验证无锁算法？

从理论上讲至少应该可以对无锁算法进行暴力验证只有这么多的函数调用组合是否有任何工具或正式推理过程可以实际证明无锁算法是正确的理想情况下它还应该能够检查竞争条件和 ABA 问题注意如果你知道一种方法来证明一点例如只证明它不受
SQL 注入：replace("'", "''") 还不够好吗？

虽然我当然可以看到使用参数进行 SQL 查询的优点特别是在处理日期时间和类似的事情时但我仍然不确定参数作为only防止SQL注入的方法事实是我继承了一个应用程序它有类似的东西 SELECT Field FROM Table WHE
JBoss Weld + java.lang.OutOfMemoryError：永久代空间

我刚刚切换到 Weld 以利用 CDI JSF 2 Beans 对话范围这是我的 Maven 依赖项
向前声明类模板显式/部分专业化有什么意义？

C 98 标准规定 temp class spec 部分专业化声明本身不能通过名称查找找到如果显式专业化也是如此则这会使类模板显式部分专业化的前向声明不可见 temp class spec match 当在需要实例化该类的上下文中使用
flutter SDK是否提供了为Windows Phone开发应用程序的框架？

我想知道google是否计划支持除iOS和Android以外的任何其他平台使用Flutter进行跨平台开发像React Native Windows for React Native一样 Flutter是否有支持Windows Phone
Android 中的错误消息“HTTP 413 请求实体太大”

当我使用 POST 方法使用 Multipart Part 发送图像文件时它抛出此错误 retrofit2 adapter rxjava HttpException HTTP 413 请求实体太大通过该错误很明显您在请求中发送的文件大
如何在 JPA 2 / Hibernate 中进行可移植和本机 ID 生成？

我希望在当前运行 Hibernate 和 MySQL 的 JPA 2 实体上生成本机和可移植的 ID 当使用 GenerateValue strategy AUTO 时 hibernate 默认为 MySQL 上的 hibernate se

随机推荐

使用 Pandas 替换缺失值

Country USA Age 52 Sal 12345 OnWork No Country UK Age 23 Sal 1142 OnWork Yes Country MAL Age 25 Sal 4456 OnWork No Count
JavaScript 正则表达式

当我遇到这个问题时我正在尝试为其他人做正则表达式要求是正则表达式应该从一组字符串中返回结果比方说其中包含 apple 例如考虑以下字符串 I have an apple You have two Apples I give you
如何将 Papa.parse 结果放入数组中

预警我是 js 新手我编写的以下代码取自从 Javascript 对象中的 CSV 检索解析后的数据使用 Papa Parse https stackoverflow com questions 26266459 retrieve p
连续行之间的日期差异 - 复杂

我之前发过一篇question https stackoverflow com questions 9994862 date difference between consecutive rows已得到答复但我也需要对此进行查询我有一个
如何修复每当我在 Expo React-Native 中使用 KeyboardAwareView 或 React-native-keyboard-aware-scroll-view 时显示的白色键盘空间？

我在创建应用程序时使用 Expo react native 但使用 KeyboardAvoidingView 和其他键盘包 react native keyboard aware scroll view 在屏幕底部显示空白我该如何解决 h
通过浏览器中的令牌访问敏感的 Spring boot 执行器端点

我们在我们的服务中使用 Spring Boot Actuator Endpoints 我们希望保护某些端点的安全这些端点只能由管理支持团队访问以解决问题例如 logfile env shutdown restart 根据 Spring
使用 COPY FROM stdin 将 bytea 数据导入 PostgreSQL

我通过外部程序生成了一个 UTF 8 文件用于导入 PostgreSQL 9 6 1 问题是bytea场 PWHASH 此文件的片段使用 TAB 作为分隔符 COPY USERS ID CODE PWHASH EMAIL FROM st
关于类成员函数指针的sizeof[重复]

这个问题在这里已经有答案了假设我们有一个 A 类 class A 和这些 typedef typedef void A a func ptr void typedef void func ptr void 我的问题是为什么 sizeof
请讨论什么是 portlet 以及为什么使用 portlet

为什么我要在 tomcat 和 gwt 之上使用 java portlet Portlet 是否会减少或不需要我使用 jsp 和 jsf Jboss 是否已成为 Portlet 演化文化的一部分 Jboss 是否满足 portlet jsr
无法解析类型“jint”，以及 JNIEnv、jclass

尝试使用 jni c 代码构建一个简单的 helloWorld android java 应用程序我在 Windows 7 上使用 Eclipse Indigo 在非空间路径中安装了 ndk r8 最终使用 ndk build cmd 构
Linux 获取开机以来的系统时间

我需要找到系统时间因为我的 C 代码中的 Linux 机器已通电 time 和 gettimeofday 等函数返回自纪元以来的时间而不是开机以来的时间如何查找自开机以来的时间或时钟滴答数提前致谢该信息是通过以下方式提供的 pro
清单中的 Android 抽象活动

对于我的应用程序我将创建各种扩展 android app Activity 和 android app Service 类的抽象类当我对抽象类进行子类化时如何将它们添加到 Android 清单中我是否需要将抽象类和我的子类都添加到清
使用 Jsoup 获取网页元素

我正在尝试使用Jsoup从名为 Morningstar 的网站获取股票数据我查看了其他论坛但无法找出问题所在我正在尝试进行更高级的数据报废但我似乎甚至无法获得价格我要么返回 null 要么什么也没有返回我知道其他语言和 API
Doctrine – 如何在两个实体之间建立一对一的关系

我有两个表用户和联系人 Users id username Contacts id user id 电子邮件我简化了结构那么如何正确设置条令实体呢 ORM Entity ORM Table name users class User
从sql server 2005迁移到2008对应用程序的影响

我们正在将 ASP NET Web 应用程序的后端从 sql server 2005 升级到 sql server 2008 或 2012 您能告诉我这对整个应用程序有什么影响吗所有这些改变我们都必须做一次彻底成功的转型我们也在考虑将前
如何正确扩展WCF返回的类？

我在我的项目中使用 WCF 服务该服务返回一个名为 Store 的类我创建了一个继承自 Store 的新本地类我的课程名为 ExtendedStore 我的 ExtendedStore 看起来像这样 class ExtendedSto
仅在 Linux 上通过命令行将 xlsx 转换为文本 CSV [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案简单的问题目前是否可以从命令行调用 LibreOffice 以打开 xlsx 并将其转换另存为 csv 或者如果这是不可能的当前通过命令行执行
使用 Javascript 生成 SVG 路径的库？

我在用着Rapha l http raphaeljs com 满足我的 SVG 渲染需求但我发现 Path 语法有点低级那么有谁知道一个很好的 Javascript 包装器库它允许这样的事情 var pathStr move 10
指针条件 while(*s1++=*s2++)

int main char str1 Overflow char str2 Stack char s1 str1 s2 str2 while s1 s2 printf s str1 return 0 当这个条件被打破时 while s1 s
Python 并行计算 - Scoop

我正在尝试熟悉 Scoop 库此处的文档 https media readthedocs org pdf scoop 0 7 scoop pdf https media readthedocs org pdf scoop 0 7 scoo

Python 并行计算 - Scoop

Python 并行计算 - Scoop 的相关文章

随机推荐

热门标签