什么是变量变换?

变量转换定义了用于变量某些值的转换。换句话说,对于每个对象,旋转都用于该对象的变量值。例如,如果只有变量的重要性是必要的,那么可以通过创建绝对值来更改变量的值。

变量变换有两种类型:简单函数变换和归一化。

简单功能

一个简单的数学函数独立地用于每个值。如果 r 是变量,则此类转换的示例包括 x k ,logx, e x ,$\sqrt{x}$,$\frac{1}{x}$,sinx,或 |x|。在统计学中,变量变换,特别是 sqrt、log 和 1/x,被应用于将不具有高斯(正态)分布的记录转换为具有高斯分布的信息。虽然这可能是必不可少的,但在数据挖掘中可能会出现一些原因。

考虑感兴趣的变量是会话中的几个数据字节,这些字节的范围从 1 到 10 亿。这是一个巨大的范围,使用 log10 转换压缩它可能是有利的。在这种情况下,传输 10 8和 10 9字节的会话将比传输 10 和 1000 字节的会话更相似(9 - 8 = 1 与 3 - 1 = 2)。

应谨慎应用变量转换,因为它们会改变数据的性质。如果不完全尊重转换的特征,则可能会出现问题。例如,变换 1/x 会降低 1 或更高值的重要性,但会增加介于 0 和 1 之间的值的重要性。

标准化或标准化

另一种常见的变量转换类型是变量的标准化或归一化。标准化或规范化的目标是创建一组具有特定属性的值。一个常见的例子是统计中的“标准化变量”。如果 x '是属性值的均值(平均值), s x是它们的标准差,则变换 x ' = (x –x ' )/ s x ) 创建一个新变量,其均值为 0,a标准差 1。

如果要以某种方式组合不同的变量,则通常需要进行这种转换以避免具有较大值的变量主导计算结果。

均值和标准差受异常值的影响很大,所以上面的变换经常被修改。首先,将均值替换为中值,即中间值。其次,将标准差替换为绝对标准差。具体来说,如果 r 是一个变量,那么 r 的绝对标准差由 $\mathrm{\sigma_{A}=\displaystyle\sum\limits_{i=1}^m |X_{i}-\mu| 给出}$其中 x i是变量的第 i值,m 是对象的数量,μ 是平均值或中位数。

以上是 什么是变量变换? 的全部内容, 来源链接: utcz.com/z/297105.html

回到顶部