PCA中第一个组分涵盖的方差的99%的显着性

当第一个组分覆盖PCA分析总方差的99%以上时,它代表什么意思/意味着什么? 我有一个大小为500X1000的特征矢量,我使用Matlab的pca函数返回[coeff,score,latent,tsquared,解释]。 “解释”变量返回每个组件覆盖的方差百分比。PCA中第一个组分涵盖的方差的99%的显着性

回答:

explained告诉你如何通过使用该主体组件来表示数据的准确性。在你的情况下,这意味着只需使用主要的主要组件,就可以非常准确地(至99%)描述数据。

让我们做一个2D例子。想象一下,你有数据是100x2,你做PCA。

结果可能是这样的(从互联网络获得)

这些数据会给你(图中PCA第一维大绿色箭头)为第一主成分的explained值约90%。

这是什么意思?

这意味着如果您将所有数据投影到该线上,您将以90%的精度重建点(当然,您将丢失PCA二维方向的信息)。

在你的例子中,99%的视觉效果意味着几乎所有的蓝色点都放在大绿色的​​箭头上,而小的绿色箭头方向上的变化很小。

当然,用1000维而不是2维可视化的方式更难,但我希望你能理解。

以上是 PCA中第一个组分涵盖的方差的99%的显着性 的全部内容, 来源链接: utcz.com/qa/260560.html

回到顶部