“中位数”与“均值”

问题描述:

“中位数”与“均值”
请问这两者有什么区别,

中位数(Median)表示一组数据按照大小的顺序排列时,中间位置的那个数值,即针对某个变量,有50%的个案的取值在中位数以下.通俗的讲,样本的所有观测值中,有一半数比中位数大,有一半数比中位数小.中位数的计算时会面临两种情况:当样本数(n)是奇数时,将样本的所有观测值按由小到大(或由大到小)的顺序排列,排在中间位置上的数值即为中位数;当样本为偶数时,排在中间两个位置上的数值的平均值即为中位数.中位数适用于定序变量,对于定距变量,还是首先对观测值进行分组,简单的方法就是用中间那一组的组中值作为变量的中位数.
平均数(Mean)也叫均值,等于样本的所有n个观测值之和除以样本量.假设n个观测值用x1,x2,……x n表示,均值用 x 表示,均值的公式为:
这里公式(2)是针对分组的数据而言,其中X表示某变量的取值,f 表示变量落在某一组中的频数,∑ 表示对所有的值求和(或者对所有的组求和).
平均数是最典型也是最常用的统计量,适用于定距变量和定比变量.平均数也是最有“意义”的统计量,它可以看作是数据的“平衡点”或“重心”位置所在.因为中位数在计算时,使用到了所有的数据,所以与众数和中位数相比,所包含的信息量最大.但是平均数受受极端值的影响很大,个别的极端值会直接影响平均数的熟知的变化,不如中位数和众数稳定.因此当调查的数据分布比较规则,不存在什么极端值,或数据对中心的偏离不是很大的情况下,平均数是很好的描述统计量;如果存在极端值或分布步偏离比较大时,还必须使用众数和中位数的来补充描述.
众数、中位数、均值都是对变量分布中心的描述,其中均值最为常用.