PCA是否具有分类功能?

据我了解,我认为PCA只能用于连续功能。但是,在尝试了解onehot编码和标签编码之间的区别时,是通过以下链接中的帖子获得的:

何时使用One Hot

Encoding,LabelEncoder和DictVectorizo​​r?

它指出,在PCA之后进行热编码是一种非常好的方法,这基本上意味着PCA被应用于分类特征。因此感到困惑,请在同一点上建议我。

回答:

我不同意其他观点。

虽然 (例如,单热编码数据) 但这并不意味着它是一件好事,否则它将非常有效。

PCA被设计用于 连续 变量。它试图最小化方差(=平方偏差)。当您拥有二进制变量时,平方差的概念会破裂。

是的,您可以使用PCA。是的,您会得到一个输出。它甚至是最小二乘的输出-好像PCA不会对此类数据进行分段处理。它可以工作,但 意义

远不如您希望的那样。并且据认为比例如频繁模式挖掘更没有意义。

以上是 PCA是否具有分类功能? 的全部内容, 来源链接: utcz.com/qa/423380.html

回到顶部