请问数据标准化和统计学的关系

问题描述:

请问数据标准化和统计学的关系

数据标准化是统计学中对数据进行分析前处理的一种方法,目的在于消除数据计量单位及变异程度.
例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两个事例中第1个变量观察值之差的绝对值(单位是kg)与第2个变量观察值之差的绝对值(单位是cm )相加的情况.使用者会说5kg的差异怎么可以与3cm的差异相加?不同变量自身具有相差较大的变异时,会使在计算出的关系系数中,不同变量所占的比重大不相同.例如如果第1个变量(两水稻品种米粒中的脂肪含量)的数值在2%到4%之间,而第2个变量(两水稻品种的亩产量)的数值范围都在1000与5000之间.为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化.