当第一个分量覆盖 PCA 分析中总方差的 99% 以上时,这意味着什么?
我有一个大小为 500X1000 的特征向量,我在其中使用了 Matlab 的 pca 函数,该函数返回 [coeff,score,latent,tsquared,explained]。变量“explained”返回每个分量所覆盖的方差百分比。
The explained
告诉您仅使用该主成分可以如何准确地表示数据。在您的情况下,这意味着仅使用主要主成分,您就可以非常准确地描述数据(达到 99%)。
让我们做一个 2D 例子。想象一下你有这样的数据100x2
然后你做PCA。
结果可能是这样的(取自互联网)
该数据将为您提供explained
第一主成分(图中 PCA 第一维大绿色箭头)的值约为 90%。
这是什么意思?
这意味着,如果将所有数据投影到该线上,则将以 90% 的准确度重建点(当然,您将丢失 PCA 二维方向上的信息)。
在您的示例中,99% 在视觉上意味着几乎所有蓝色点都位于绿色大箭头上,绿色小箭头方向上的变化很小。
当然,用 1000 维而不是 2 维进行可视化要困难得多,但我希望你能理解。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)