Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
有没有办法为数据表绘制UMAP或t-SNE图?
我有一个巨大的文件 下面是一小部分数据 如下所示 我想绘制一个 PCA 我可以使用 PCA 函数绘制 PCA 但它看起来有点乱 因为我有 200 列 所以我想也许 t SNE 或 UMAP 效果更好 但我无法使用它们进行绘图 我想在图中显示
r
ggplot2
PCA
runumap
带插入符的主成分分析
我正在使用 Caret 的 PCI 预处理 multinomFit lt train LoanStatus train method multinom std TRUE family binomial metric ROC thresh 0
r
PCA
rcaret
Matlab - 多维数据的PCA分析与重构
我有一个大型多维数据集 132 维 我是数据挖掘的初学者 我想使用 Matlab 来应用主成分分析 不过 我看到网上有很多功能解释 但我不明白它们应该如何应用 基本上 我想应用 PCA 并从我的数据中获取特征向量及其相应的特征值 在此步骤之
MATLAB
datamining
PCA
Python 中的主成分分析
我想使用主成分分析 PCA 来降维 numpy 或 scipy 是否已经有了它 或者我必须使用自己的numpy linalg eigh http docs scipy org doc numpy reference generated nu
python
NumPy
scipy
PCA
PySpark PCA:避免 NotConvergedException
我试图通过 ml linalg 方法使用 PCA 来减少广泛的数据集 51 个特征 约 1300 个个体 如下所示 1 将我的列命名为一个列表 features indi prep df select c for c in indi pre
PySpark
PCA
decomposition
是否可以对任何文本分类应用 PCA?
我正在尝试用 python 进行分类 我正在对网页使用朴素贝叶斯多项式NB分类器 将数据从网络检索到文本 稍后我对此文本进行分类 网络分类 现在 我尝试对这些数据应用 PCA 但 python 给出了一些错误 我的朴素贝叶斯分类代码 fro
python
scikitlearn
PCA
naivebayes
PySpark 中的 PCA 分析
看着http spark apache org docs latest mllib Dimensionality reduction html http spark apache org docs latest mllib dimensio
python
apachespark
apachesparkmllib
PCA
apachesparkml
对具有大量零特征的数据进行归一化/标准化是否有利
我拥有大约 60 个特征的数据 在我的训练数据中 大多数情况下大多数情况下都为零 只有 2 3 列可能有值 准确地说是其性能日志数据 但是 我的测试数据在其他一些列中会有一些值 我已经完成了归一化 标准化 分别尝试了两者 并将其提供给 PC
python
machinelearning
PCA
SVD
normalize
如何在 500,000 个点的 100 维空间中找到最近的 2 个点?
我有一个 100 维空间中有 500 000 个点的数据库 我想找到最接近的 2 个点 我该怎么做 更新 空间是欧几里得的 抱歉 并感谢所有的答案 顺便说一句 这不是家庭作业 里面有一章算法简介 http en wikipedia org
Algorithm
performance
nearestneighbor
PCA
approximatennsearching
R 中的 PCA 多重图
我有一个如下所示的数据集 India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong 0 0854
r
plot
3d
clusteranalysis
PCA
错误:点太少,无法用 3 个点计算椭圆? -R
日安 我正在策划一个pca与factoextra包裹 我对每个因素有 3 分 并且想在每个因素周围画上椭圆 但我收到错误Too few points to calculate an ellipse 可以在 3 个点周围绘制椭圆ggplot2
r
plot
ggplot2
PCA
ellipse
sklearn 中估计器管道的参数 clf 无效
有人可以检查以下代码的问题吗 我在构建模型的过程中是否有任何错误 我已经在参数中添加了两个 clf clf RandomForestClassifier pca PCA pca clf make pipeline pca clf kfold
python
scikitlearn
pipeline
PCA
使用 R 重现 SPSS 因子分析
我希望有人能指出我正确的方向 首先 我不是统计学家 我是一名软件开发人员 其任务是尝试使用 R 重现 SPSS 因子分析的结果 使用 PC 提取和最大方差旋转 我在过去一周才接触过 R 所以我试图找到我的方式 我确实发现 2010 年的这篇
r
spss
PCA
factoranalysis
ggplot2:调整 R 中 PCA 双图中 PCA 载荷的标签位置
Issue 我制作了一个PCA biplot使用包ggbiplot ggplot2 我使用该函数延长了载荷 箭头 geom segment 我想删除原始加载 短箭头 保留较长加载 新箭头 保留带有灰色背景的标签 但重新定位它们 使它们不重叠
r
ggplot2
PCA
ggplotly
ggbiplot
R 中 PCA 的结果载荷
在R中进行PCA时 p lt princomp iris 1 4 我通过以下两种方法得出不同Component的系数 IrisLoading lt p loadings 1 2 methods1 use the fist two Comp
r
PCA
sklearn多类SVM函数
我有多个类标签 想要计算模型的准确性 我有点困惑我需要使用哪个 sklearn 函数 据我了解 以下代码仅用于二元分类 dividing X y into train and test data X train X test y train
machinelearning
scikitlearn
Classification
SVM
PCA
在 ggplot2 示例中绘制来自 vegan 的 ordiellipse 不起作用
我正在尝试在 ggplot 中绘制一个带有椭圆体的 pca 双图 我在中找到了一个例子这个线程在这里 https stackoverflow com questions 13794419 plotting ordiellipse funct
r
ggplot2
PCA
vegan
如何使用 FactoMineR 包以编程方式确定主成分的列索引?
给定一个包含混合变量 即分类变量和连续变量 的数据框 例如 digits 0 9 set seed for reproducibility set seed 17 function to create random string creat
r
clusteranalysis
PCA
featureselection
unsupervisedlearning
如何在 Python 中使用 PCA/SVD 进行特征选择和识别?
我正在跟进Python 中的主成分分析 https stackoverflow com questions 1730600 principal component analysis in python在Python下使用PCA 但我很难确定
python
scipy
PCA
如何使用 scikit learn inverse_transform 和新值
我有一组数据是我使用scikit learn PCA 我在使用 StandardScaler 执行 PCA 之前对数据进行了缩放 variance to retain 0 99 np scaled StandardScaler fit tr
python
scikitlearn
PCA
1
2
3
4
5
»