部分拟合是否在 sklearn.decomposition.IncrementalPCA 中并行运行？

2024-05-05

我已经关注了伊马诺·卢恩戈 https://stackoverflow.com/users/764322/imanol-luengo's answer https://stackoverflow.com/a/44335148/10183880建立部分拟合和变换sklearn.分解.增量PCA https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.IncrementalPCA.html#sklearn.decomposition.IncrementalPCA.partial_fit。但由于某种原因，看起来（来自 htop）它最大程度地使用了所有 CPU 核心。我既找不到 n_jobs 参数，也找不到与多处理相关的任何内容。我的问题是：如果这是这些函数的默认行为，我该如何设置 CPU 的数量以及在哪里可以找到有关它的信息？如果没有，显然我在代码的前面部分做错了一些事情。

PS：我需要限制CPU核心的数量，因为使用服务器中的所有核心会给其他人带来很多麻烦。

附加信息和调试代码：所以，已经有一段时间了，我仍然无法弄清楚这种行为的原因或如何限制一次使用的 CPU 核心数量。我决定提供示例代码来测试它。请注意，此代码片段取自sklearn 的网站 https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.IncrementalPCA.html。唯一的区别是增加了数据集的大小，因此人们可以轻松地看到行为。

from sklearn.datasets import load_digits
from sklearn.decomposition import IncrementalPCA
import numpy as np

X, _ = load_digits(return_X_y=True)

#Copy-paste and increase the size of the dataset to see the behavior at htop.
for _ in range(8):
    X = np.vstack((X, X))

print(X.shape)

transformer = IncrementalPCA(n_components=7, batch_size=200)
transformer.partial_fit(X[:100, :])
X_transformed = transformer.fit_transform(X)

print(X_transformed.shape)

输出是：

(460032, 64)
(460032, 7)

Process finished with exit code 0

And the htop shows:

TL:DR 通过设置 BLAS 环境变量解决了该问题在导入 numpy 或任何导入 numpy 的库之前与下面的代码。详细信息可以查到here https://stackoverflow.com/a/56126088/10183880.

很长的故事：我正在寻找解决此问题的方法另一个帖子 https://stackoverflow.com/q/55746872/10183880我发现这不是因为 scikit-learn 实现错误，而是因为 numpy 库使用的 BLAS 库（特别是 OpenBLAS），该库在 sklearn 的 IncrementalPCA 函数中使用。默认情况下，OpenBLAS 设置为使用所有可用线程。详细信息可以查到here https://stackoverflow.com/a/56126088/10183880.

import os
os.environ["OMP_NUM_THREADS"] = 1 # export OMP_NUM_THREADS=1
os.environ["OPENBLAS_NUM_THREADS"] = 1 # export OPENBLAS_NUM_THREADS=1
os.environ["MKL_NUM_THREADS"] = 1 # export MKL_NUM_THREADS=1
os.environ["VECLIB_MAXIMUM_THREADS"] = 1 # export VECLIB_MAXIMUM_THREADS=1
os.environ["NUMEXPR_NUM_THREADS"] = 1 # export NUMEXPR_NUM_THREADS=1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

部分拟合是否在 sklearn.decomposition.IncrementalPCA 中并行运行？的相关文章

Python 中带有大稀疏矩阵的 kNN

我有两个大的稀疏矩阵 In 3 trainX Out 3 lt 6034195x755258 sparse matrix of type
Python：UnicodeDecodeError：“utf8”编解码器无法解码字节

我正在将一堆 RTF 文件读入 python 字符串中在某些文本上我收到此错误 Traceback most recent call last File 11 08 py line 47 in
使用 futures.ProcessPoolExecutor 但不使用带有 PRAW 包装器的 futures.ThreadPoolExecutor 时出现递归最大错误

我正在使用此代码来抓取 API submissions get submissions 1 with futures ProcessPoolExecutor max workers 4 as executor or using this w
利用“写入时复制”将数据复制到 Multiprocessing.Pool() 工作进程

我有一点multiprocessingPython 代码看起来有点像这样 import time from multiprocessing import Pool import numpy as np class MyClass objec
无法通过Anaconda/jupyter获取MNIST数据库

Hu guys 我是 python anaconda jupyter numPy panda 等的新手所以如果这是一个非常愚蠢的问题请原谅我我正在尝试使用 anaconda jupyter 获取 MNIST 数据库但每次我最后都会收
将 OneClassSVM 与 GridSearchCV 结合使用

我正在尝试在 OneClassSVM 上执行 GridSearchCV 函数但我似乎无法找到 OCSVM 的正确评分方法根据我收集的信息像 OneClassSVM score 这样的东西不存在因此 GridSearchCV 中没有所
scikit-learn：SVC 和 SGD 有什么区别？

SVM http scikit learn org stable modules svm html classification http scikit learn org stable modules svm html classific
类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个

我有熊猫数据框df 我想对连续和分类特征进行编码df使用不同的编码器我觉得用起来很舒服make column transformer 但是下面显示的代码失败了LabelEncoder 但可以很好地与OneHotEncoder handle
ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

我有一个这样设置的目录 images val class1 class2 test all classes train class1 class2 每个目录中都有一组图像我想预测测试中的每个图像是否属于 1 类或 2 类我写这个是为了读
将 python scikit learn 模型导出到 pmml

我想将 python scikit learn 模型导出到 PMML 中什么 python 包最适合我读到Augustus https github com opendatagroup augustus 但我找不到任何使用 scikit
在提供给 sklearn 管道中的分类器之前获取所选特征的名称和数量

我在用sel SelectFromModel ExtraTreesClassifier 10 threshold mean 选择我的数据集中最重要的特征然后我想将这些选定的特征提供给我的 keras 分类器但是我的基于 keras 的神
属性错误：未找到下层；在 scikit-learn 中使用带有 CountVectorizer 的 Pipeline

我有一个这样的语料库 X train this is an dummy example in reality this line is very long here is a last text in the training set 和一
在 SciKit-Learn 中使用 Pipeline 计算排列重要性

我正在使用来自的确切示例SciKit https scikit learn org stable auto examples inspection plot permutation importance html sphx glr auto
为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？

在 Jupyter 笔记本上本地运行并使用 MNIST 数据集 28k 条目每个图像 28x28 像素以下内容为27秒 from sklearn neighbors import KNeighborsClassifier knn clf
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
sklearn：使用 Pipeline 和 TransformedTargetRegressor 缩放 x（数据）和 y（目标）

我想使用 Pipeline 和 TransformedTargetRegressor 来处理所有缩放数据和目标是否可以混合 Pipeline 和 TransformedTargetRegressor 如何从 TransformedTar
如何指定聚类的距离函数？

我想对给定距离的点进行聚类奇怪的是似乎 scipy 和 sklearn 聚类方法都不允许指定距离函数例如在sklearn cluster AgglomerativeClustering 我唯一可以做的就是输入一个亲和力矩阵这将非常
如何在sklearn管道中通过特征消除选择特征名称？

我在 sklearn 管道中使用递归特征消除管道看起来像这样 from sklearn pipeline import FeatureUnion Pipeline from sklearn import feature selection
使用 scikit-learn 进行二次采样 + 分类

我正在使用 Scikit learn 进行二元分类任务并且我有 0 级有 200 个观察值第 1 类有 50 个观察值而且因为我有不平衡的数据我想抽取多数类的随机子样本其中观察数量与少数类相同并且希望使用新获得的数据集作为分
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不

随机推荐

如果没有 Scaffold，Material App 样式将无法工作

我正在尝试创建一个没有 Scaffold 元素的 Material design 应用程序这是纯粹的默认应用程序 import package flutter material dart void main gt runApp MyApp
表达式树深度限制

我在尝试对类型为 Expression gt 的 LambdaExpression 调用 Compile 时遇到问题该表达式的深度约为 400 较小的值不会导致任何问题我找不到任何有关此类限制的信息谁能澄清这一点吗我可以增加这个限制
递归地更改R中嵌套列表中的名称

我在 R 中的嵌套列表结构中有数据我想使用查找表来更改名称无论它们在结构中的位置例子 build up an example x lt as list c a NA x 1 lt vector list 4 names x 1 lt
Spring Cloud Gateway + Spring安全资源服务器

我真的不会把它放在这里但我真的很困惑我想实现以下目标我在跑步 Java 14 Spring Cloud Gateway版本 Hoxton SR3 Spring Boot版本 2 2 5 RELEASE 现在我想将安全性集成到我的网关和
我如何自动接受 git rebase --interactive 呈现给我的内容？

我正在使用一个小脚本来修复过去的提交该脚本假设已暂存对损坏的提交的修复工作目录是干净的并且损坏的提交是在命令行上传递的这是脚本的原始 Python 核心 usr bin env python import os import sys
在 Ruby 中，哈希中标识符后面的冒号的含义是什么？

我正在了解 Factory Girl 我看到了这段代码 factory post do association author factory user last name Writely end why do factory and las
禁用特定的 ServletContextListener 以防止在 tomcat 上启动

我的项目正在使用spring boot with webflux tomcat 我有一个内部库类它是ServletContextListener WebListener public class DevIoServletContextLi
在 Heroku 应用程序中同时运行 Django 和 Node

我想在我的 heroku 实例上同时运行 django 应用程序和节点应用程序这是我的进程文件 web python manage py runserver 0 0 0 0 PORT web node bin node modules a
如何让 pyautogui click 在 mac 上运行？

pyautogui点击方法问题我正在从 Spyder 运行脚本如果我单击 Spyder 窗口上的任何内容则单击效果很好如果我执行脚本打开 Outlook 然后单击任何内容则不会发生单击虽然我能够正确使用 moveTo 功能我按
点击取消时 htpasswd 被绕过

在我的 htaccess 中我有以下代码用于保存 admin 区域如果我提供了错误的用户名密码它会不断弹出正确的用户名但如果我按取消我可以看到我的限制区域而不是加载错误页面这是怎么回事谢谢 AuthName Restric
Play2 的异常无法在 postgresql 上运行

我发现play2的anorm的行解析器依赖于jdbc驱动程序返回的元数据所以在play提供的内置示例 zentasks 中我可以找到这样的代码 object Project val simple get Pk Long project
PL/SQL：如何声明会话变量？

如何在 PL SQL 中声明一个会话变量该变量仅在会话期间持续存在而无需将其存储在数据库本身中您可以使用用户创建的上下文来存储会话中多个单元共享的数据首先创建一个上下文 CREATE CONTEXT SYS CONTEXT u
mod_wsgi 下的 psp（python 服务器页面）代码？

有没有办法在 apache mod wsgi 下运行 psp python 服务器页面代码虽然我们正在转向基于 wsgi 的新框架但我们仍然有一些用 psp 编写的遗留代码这些代码在 mod python 下运行我们希望能够在托管
nodeJS require.paths 解决问题

我试图相对且神秘地需要一个文件以下情况正在发生这很有效这表明 Users marcos Desktop Taper lib utils js myPath Users marcos Desktop Taper lib utils re
如何在 ASP.NET Core（不是旧版本！）中实现自定义 UserStore（或自定义身份验证）

我正在尝试使用 ASP NET Core 1 2016 年 5 月构建新网站并且我需要实现不同类型的登录过程不是使用 SQL Server 所以我正在尝试实施MyOwnUserStore 我想重写登录过程但是当我启动应用程序时结果
Windows Azure - 无单点故障的领导者实例

我正在寻找一种在多个辅助角色实例上拥有单例模块的方法我希望在 Azure 中拥有一个带有队列和多个辅助角色的并行执行模型这个想法是希望有一个主实例也就是说检查新数据并通过将其添加到队列来调度它处理来自特殊队列的所有消息该
找不到映射模型（Cocoa 错误 134140）

基本上我有一个版本xcdatamodel我正在从 V2 迁移到 V3 我创建了一个Mapping Model具有自定义策略一旦PersistenStoreCoordinator试图完成它的工作我打了一个Cocoa错误号134140 找
如何通过将鼠标移动到图表区域来显示折线图的最近数据点信息

我将在 Windows 窗体应用程序中使用 C 绘制图表我需要在折线图上画一个圆圈并在标签上显示该数据点值当鼠标移动到图表区域上时该标签距离鼠标指针的 x 轴最近的数据点我写了一段代码如下 private void Chart1
我可以渲染 :partial 没有前导下划线的视图吗？

我在这里面临着不稳定的状况我需要部分渲染没有前导下划线的页面这将寻找 app views home contact html erb 但我想让它寻找 app views home contact html erb 有办法做到这一点吗 T
部分拟合是否在 sklearn.decomposition.IncrementalPCA 中并行运行？

我已经关注了伊马诺卢恩戈 https stackoverflow com users 764322 imanol luengo s answer https stackoverflow com a 44335148 10183880建立部

部分拟合是否在 sklearn.decomposition.IncrementalPCA 中并行运行？

部分拟合是否在 sklearn.decomposition.IncrementalPCA 中并行运行？ 的相关文章

随机推荐

热门标签

部分拟合是否在 sklearn.decomposition.IncrementalPCA 中并行运行？的相关文章