计量经济学中为什么误差项u服从正态分布,则系数也服从正态分布

问题描述:

计量经济学中为什么误差项u服从正态分布,则系数也服从正态分布

这个性质主要是针对线性回归和OLS(普通最小二乘法)估计量而言的,举个简单点的例子:y=xβ+u(当然,y,x,β和u都可以是矩阵/向量),其中系数β都是真值(也就是确定量而不是随机变量,不存在分布之类的概率统计意义上的问题).
根据高斯马尔可夫经典假设,解释变量x也是确定量,从而误差项u服从正态分布将直接导致被解释变量y服从正态分布.
另外还应指出的一点是,你问题中的系数确切地说应该是系数的估计值.几乎所有的计量经济学初级教材中都会指出并证明OLS估计量(即系数的估计值)的几个性质:线性性,一致性和有效性(即最小方差性).你问的问题涉及到了OLS估计量的线性性,所谓线性性质,就是指系数的估计值β‘(暂且用β’表示,因为这里加^比较麻烦)与被解释变量y之间存在线性关系,不妨表示成β‘=ay.刚才已经提到,被解释变量y服从正态分布,因此也就可以得到系数β的OLS估计量β‘服从正态分布.(注意到系数的真值β是一个确定量而不是随机变量.)
这完全是数学意义上的推导,线性性质的证明这里就不写了,翻翻教材就可以找到.
Good luck.谢谢您!但还有个问题:为什么说x是确定的量,从而使得当u服从正态分布时导致y也服从正态分布(这个问题困扰我很久了,为什么能把x看成给定的,因为我感觉x,y应该是平等对称的呀)。再问另一个问题,为什么说残差和y^是不相关的,我觉得y-y^就是残差呀,所以这两个肯定相关的呀。这么解释吧,回归分析是建立在两个(或者多个)变量存在因果关系的基础之上的,如果这些变量之间相互影响,并且无法确定孰因孰果,那么只能做相关分析,而不能做回归分析。NOTE:这是很多初学者容易忽略的一点,如果你做的是回归分析,那么就默认了这些变量之间是存在因果关系的,其中一些变量(也就是常说的解释变量)是引起另一些变量(也就是常说的被解释变量)的原因,相应地,被解释变量是由解释变量变化引起的结果。在这个逻辑基础上,一般我们把解释变量“默认”为确定量,但是由于各种各样的随机因素的影响,被解释变量不可能完全按照假设的模型形式(即使这个模型设定是正确的,实际上绝大多数模型设定都是不正确的)以及给定的解释变量的值变化,换句话说,被解释变量的值不可能完全等于解释变量的值代入模型中计算得到的结果,既然我们把解释变量“默认”为确定量,那么被解释变量就成了不确定量,也就是随机变量,因为有一些随机因素在干扰,使得它不等于我们的模型计算出来的由确定的解释变量和确定的模型形式得到的确定量。不过你再学下去会发现:把解释变量“默认”为确定量这个假设可以放宽到假设解释变量与残差项不相关(这时解释变量可以认为是随机变量了),OLS估计量的一些良好性质在这个新假设下仍然成立。第二个问题也可以接着上面的逻辑解释:y^是由确定的解释变量和确定的模型形式计算出来的,显然是确定量。而残差是随机量,确定量和随机量直接当然不相关,只能说y和残差项u是相关的。不好意思,还是不太明白为什么从因果关心的角度就能把x认为确定量,以后又可以看成随机变量?第二个问题我想问的是y^为什么和u^不相关?谢谢Sorry,前两天没上百度。。。拖到今天才回复。。。把x认为确定量仅仅是一个假设而已,但是在进一步的学习后你会发现这个假设并不是必要的,只是为了在初学时方便理解而引入的。而并不是说x一会是确定量,一会是随机量。但是,即使不需要“x是确定量”这个假设,“x与随机项u不相关”这个假设是一定要满足的,否则OLS估计量的一些性质将不再满足。再看这两个式子:y^=x·β^和y=x·β^+u^y^只与x以及β^相关,因为x与u(这里用估计量u^代替)不相关,所以y^与u(u^)不相关。(β^是估计出来的,和u/u^没有任何关系。)而y=x·β^+u^则明确显示出了y与u^的相关关系。谢谢您不厌其烦的指教。第一个问题还有一个不明白的地方:若把x"看成"确定的,则y与u同分布,这个比较明确,但把x确定这个假设放开的时候,从直观上怎么看出y与u同分布呢?谢谢