统计学原理抽样估计计算题某地区对居民用于某类消费品的年支出数额进行了一次抽样调查,抽取了900户居民,调查得到的平均每户支出数额为550元,标准差为107元,支出额在800元以上的有180户,试在95%(Za/2=1.96)的置信水平下估计:1.平均每户支出额的区间?2.支出额在800元以上户数所占比重的区间?
统计学原理抽样估计计算题
某地区对居民用于某类消费品的年支出数额进行了一次抽样调查,抽取了900户居民,调查得到的平均每户支出数额为550元,标准差为107元,支出额在800元以上的有180户,试在95%(Za/2=1.96)的置信水平下估计:
1.平均每户支出额的区间?
2.支出额在800元以上户数所占比重的区间?
这道题需要注意的是,家庭支出额很有可能不是正态分布,由于可能出现两个极端:收入少者支出极少,而高收入者支出很大.不过,对于平均每户支出额区间的计算,按照中心极限定理,在样本量比较大的情况下(大于50),样本均值的分布是接近正态分布的,因此有:
1、
每户支出额平均值的下限=平均值 - (标准差/SQRT(样本量))×Za/2=550-107/SQRT(900)*1.96=543.01
每户支出额平均值的上限=平均值 + (标准差/SQRT(样本量))×Za/2=550+107SQRT(900)*1.96=556.99
【*代表乘号,^代表乘方号,sqrt代表开平方】
你将我的数字公式复制、粘贴至Excel的公式编辑栏中就可以直接得到计算结果.
你的“平均每户支出额的区间”这个说法有点含混不清!每户支出额平均值的区间就按照我上面的计算公式计算,得出的结果的意思就是该地区居民支出的平均值有95%的概率介于543.01--556.99之间,注意这里仅仅对该地区的平均值进行估计!
但是,如果要估计该地区居民支出的95%覆盖范围,则这条题目给出的条件是不够的,除非另外加上一条:居民支出情况服从正态分布,那么就可以按照下面的公式计算:
支出额的下限=平均值 - 标准差×Za/2=550-107*1.96=340.28
支出额的上限=平均值 + 标准差×Za/2=550+107*1.96=759.72
这个结果表明,95%的居民支出位于340.28--759.72之间(假如居民支出情况服从正态分布的话).不过,事实上,你的题目明显不符合正态分布这个假设.
2、由于每户支出额不服从正态分布,因此不能按均值正负2个标准出的公式计算支出的95%置信区间,而应该按实际情况:支出额在800元以上的有180户,那么180/800=0.225=22.5%.在对这个比率计算95%置信区间:
按二项分布的正态近似公式:
样本标准差=sqrt(0.225*(1-0.225))=0.417582327
平均值的标准误=0.417582327/sqrt(900)=0.0139194109
支出额在800元以上户数所占比重的区间的下限=0.225-0.0139194109*1.96=0.1977=19.77%
支出额在800元以上户数所占比重的区间的上限=0.225+0.0139194109*1.96=0.2523=25.23%