PCA

有没有办法为数据表绘制UMAP或t-SNE图？

我有一个巨大的文件下面是一小部分数据如下所示我想绘制一个 PCA 我可以使用 PCA 函数绘制 PCA 但它看起来有点乱因为我有 200 列所以我想也许 t SNE 或 UMAP 效果更好但我无法使用它们进行绘图我想在图中显示

r ggplot2 PCA runumap

带插入符的主成分分析

我正在使用 Caret 的 PCI 预处理 multinomFit lt train LoanStatus train method multinom std TRUE family binomial metric ROC thresh 0

r PCA rcaret

Matlab - 多维数据的PCA分析与重构

我有一个大型多维数据集 132 维我是数据挖掘的初学者我想使用 Matlab 来应用主成分分析不过我看到网上有很多功能解释但我不明白它们应该如何应用基本上我想应用 PCA 并从我的数据中获取特征向量及其相应的特征值在此步骤之

MATLAB datamining PCA

Python 中的主成分分析

我想使用主成分分析 PCA 来降维 numpy 或 scipy 是否已经有了它或者我必须使用自己的numpy linalg eigh http docs scipy org doc numpy reference generated nu

python NumPy scipy PCA

PySpark PCA：避免 NotConvergedException

我试图通过 ml linalg 方法使用 PCA 来减少广泛的数据集 51 个特征约 1300 个个体如下所示 1 将我的列命名为一个列表 features indi prep df select c for c in indi pre

PySpark PCA decomposition

是否可以对任何文本分类应用 PCA？

我正在尝试用 python 进行分类我正在对网页使用朴素贝叶斯多项式NB分类器将数据从网络检索到文本稍后我对此文本进行分类网络分类现在我尝试对这些数据应用 PCA 但 python 给出了一些错误我的朴素贝叶斯分类代码 fro

python scikitlearn PCA naivebayes

PySpark 中的 PCA 分析

看着http spark apache org docs latest mllib Dimensionality reduction html http spark apache org docs latest mllib dimensio

python apachespark apachesparkmllib PCA apachesparkml

对具有大量零特征的数据进行归一化/标准化是否有利

我拥有大约 60 个特征的数据在我的训练数据中大多数情况下大多数情况下都为零只有 2 3 列可能有值准确地说是其性能日志数据但是我的测试数据在其他一些列中会有一些值我已经完成了归一化标准化分别尝试了两者并将其提供给 PC

python machinelearning PCA SVD normalize

如何在 500,000 个点的 100 维空间中找到最近的 2 个点？

我有一个 100 维空间中有 500 000 个点的数据库我想找到最接近的 2 个点我该怎么做更新空间是欧几里得的抱歉并感谢所有的答案顺便说一句这不是家庭作业里面有一章算法简介 http en wikipedia org

Algorithm performance nearestneighbor PCA approximatennsearching

R 中的 PCA 多重图

我有一个如下所示的数据集 India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong 0 0854

r plot 3d clusteranalysis PCA

错误：点太少，无法用 3 个点计算椭圆？ -R

日安我正在策划一个pca与factoextra包裹我对每个因素有 3 分并且想在每个因素周围画上椭圆但我收到错误Too few points to calculate an ellipse 可以在 3 个点周围绘制椭圆ggplot2

r plot ggplot2 PCA ellipse

sklearn 中估计器管道的参数 clf 无效

有人可以检查以下代码的问题吗我在构建模型的过程中是否有任何错误我已经在参数中添加了两个 clf clf RandomForestClassifier pca PCA pca clf make pipeline pca clf kfold

python scikitlearn pipeline PCA

使用 R 重现 SPSS 因子分析

我希望有人能指出我正确的方向首先我不是统计学家我是一名软件开发人员其任务是尝试使用 R 重现 SPSS 因子分析的结果使用 PC 提取和最大方差旋转我在过去一周才接触过 R 所以我试图找到我的方式我确实发现 2010 年的这篇

r spss PCA factoranalysis

ggplot2：调整 R 中 PCA 双图中 PCA 载荷的标签位置

Issue 我制作了一个PCA biplot使用包ggbiplot ggplot2 我使用该函数延长了载荷箭头 geom segment 我想删除原始加载短箭头保留较长加载新箭头保留带有灰色背景的标签但重新定位它们使它们不重叠

r ggplot2 PCA ggplotly ggbiplot

R 中 PCA 的结果载荷

在R中进行PCA时 p lt princomp iris 1 4 我通过以下两种方法得出不同Component的系数 IrisLoading lt p loadings 1 2 methods1 use the fist two Comp

r PCA

sklearn多类SVM函数

我有多个类标签想要计算模型的准确性我有点困惑我需要使用哪个 sklearn 函数据我了解以下代码仅用于二元分类 dividing X y into train and test data X train X test y train

machinelearning scikitlearn Classification SVM PCA

在 ggplot2 示例中绘制来自 vegan 的 ordiellipse 不起作用

我正在尝试在 ggplot 中绘制一个带有椭圆体的 pca 双图我在中找到了一个例子这个线程在这里 https stackoverflow com questions 13794419 plotting ordiellipse funct

r ggplot2 PCA vegan

如何使用 FactoMineR 包以编程方式确定主成分的列索引？

给定一个包含混合变量即分类变量和连续变量的数据框例如 digits 0 9 set seed for reproducibility set seed 17 function to create random string creat

r clusteranalysis PCA featureselection unsupervisedlearning

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？

我正在跟进Python 中的主成分分析 https stackoverflow com questions 1730600 principal component analysis in python在Python下使用PCA 但我很难确定

python scipy PCA

如何使用 scikit learn inverse_transform 和新值

我有一组数据是我使用scikit learn PCA 我在使用 StandardScaler 执行 PCA 之前对数据进行了缩放 variance to retain 0 99 np scaled StandardScaler fit tr

python scikitlearn PCA