进行回归分析时,是先把数据标准化再取对数还是取对数后再标准化?

问题描述:

进行回归分析时,是先把数据标准化再取对数还是取对数后再标准化?

就回归分析而言,标准化不是必要的,因为标准化是数据的线性变换,不影响估计的显著性.计量模型一般不进行标准化,保持变量的原汁原味,方便估计结果的解释.多元统计里经常要标准化,如主成份分析,因子分析等.对数变换的主...也就是说在回归分析时,可以对已经取过对数的数据再进行标准化?而不是取过对数就不能再标准化了?标准化或者不标准化都可以。一般计量经济模型不做标准化,只关心是否显著。有时我们想比较哪个因素更重要,由于原始变量的单位不同(或者根本无法比较,例如重量和体积),就先作标准化,回归估计的系数称为标准化系数,标准化系数的大小能够反映变量的重要性。只取对数不标准化的话,回归结果中最大条件指数是42点多,超过了30,不是说最大条件指数超过30的话可能存在共线性吗?如果数据取对数并标准化后再回归的话,最大条件指数才1点多。这两种情况下容忍度和方程膨胀因子都满足不存在多重共线的要求。请问这种情况下应该怎么办?变量标准化不能改善回归模型的任何性能,包括R2、显著性、多重共线性,因为它只是原始指标的线性变换。我不明白最大条件指数是什么统计量,多重共线性的诊断参考膨胀因子。如果有解释变量的膨胀因子超过10就说明存在共线性,然后按照处理共线性的方法做。标准化无法消除共线性。嗯,我明白了。现在回归还遇到一个问题就是,方程的其它检验全都通过,但是模型拟合度特别低,R^2才0.05,请问这种情况该怎么解决?R2低说明现有的解释变量不是很给力。如果找不到更好的变量就只能这样了。看看系数的符号是不是和预期一致,t统计量是不是显著,这些如果还可以,也能接受。