Let x
是一个样本数据框。
set.seed(0)
x <- replicate(4, rnorm(10))
PCA 使用principal
函数从psych
包将产生:
> principal(x, nf=4, rotate="none")
...
PC1 PC2 PC3 PC4
SS loadings 1.91 1.09 0.68 0.31
Proportion Var 0.48 0.27 0.17 0.08
Cumulative Var 0.48 0.75 0.92 1.00
Proportion Explained 0.48 0.27 0.17 0.08
Cumulative Proportion 0.48 0.75 0.92 1.00
使用旋转 te PCA 解决方案varimax
标准产生现在命名的新组件RCi
表明 PC 已轮换(因此,它们不再是 PC)。
> principal(x, nf=4, rotate="varimax")
...
RC4 RC3 RC2 RC1
SS loadings 1.03 1.02 1.00 0.95
Proportion Var 0.26 0.26 0.25 0.24
Cumulative Var 0.26 0.51 0.76 1.00
Proportion Explained 0.26 0.26 0.25 0.24
Cumulative Proportion 0.26 0.51 0.76 1.00
我的问题: 为什么现在下单RC4
to RC1
数量从 4 减少到 1。RC 仍然根据 SS 的份额进行排序。由于旋转是正交的,我不明白这一点。 RC 名称的顺序传达了哪些有用的额外信息?或者如果旋转是正交的,我认为顺序是任意的是错误的吗?
Thanks!
标记,
逻辑是要认识到旋转的作用。这更多是出于教学原因。我试图展示原始组件与旋转组件的关系。举个例子,看看负载,而不仅仅是考虑的方差。
unrotated:
PC1 PC2 PC3 PC4 h2 u2
1 -0.77 -0.40 0.39 0.32 1 -6.7e-16
2 0.71 -0.28 0.63 -0.17 1 6.7e-16
3 -0.10 0.93 0.35 0.09 1 6.7e-16
4 0.90 -0.02 -0.13 0.42 1 2.2e-16
Rotated:
RC4 RC3 RC2 RC1 h2 u2
1 0.95 -0.10 -0.08 -0.29 1 -6.7e-16
2 -0.10 0.97 -0.06 0.22 1 6.7e-16
3 -0.07 -0.06 0.99 -0.05 1 6.7e-16
4 -0.34 0.27 -0.07 0.90 1 2.2e-16
特别是,查看变量 3 和 4。在未旋转的解决方案中,它们分别定义 PC2 和 PC1。现在看看旋转后的解决方案。这两个仍然标记 PC2 和 PC1(并标记为 RC2 和 RC1 以反映它们已旋转),但所考虑的方差已发生变化,因为旋转到 RC4 时 PC4 现在吸收了更多方差。 (PC3 和 PC4 也是如此,但不那么清楚。)
我想做的是代表你旋转时会发生什么。 PC1被旋转为更简单的结构,并成为RC1。
然后,因为许多人喜欢按方差顺序计算其分量,所以我按特征值(考虑平方和)进行排序。
我相信其他程序所做的是旋转和重新标记,以便组件始终称为 C1 ... Cn。我只是想看看组件来自哪里。
如果您认为它有用,我可以(最终)将此讨论添加到principal 和fa 的文档中。
Bill
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)