标准差的性质是什么?

问题描述:

标准差的性质是什么?

标准差(Standard Deviation),在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量.标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根.它反映组内个体间的离散程度.测量到分布程度的结果,原则上具有两种性质:
为非负数值,与测量资料具有相同单位.一个总量的标准差或一个随机变量的标准差,及一个子集合样品数的标准差之间,有所差别.
标准计算公式:
假设有一组数值X1,X2,X3,.XN(皆为实数),其平均值为μ,公式如图1.
标准差也被称为标准偏差,或者实验标准差,公式如图2.
图2
简单来说,标准差是一组数据平均值分散程度的一种度量.一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接*均值.
例如,两组数的集合 {0,5,9,14} 和 {5,6,8,9} 其平均值都是 7 ,但第二个集合具有较小的标准差.
标准差可以当作不确定性的一种测量.例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度.当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾.这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确.
标准差应用于投资上,可作为量度回报稳定性的指标.标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高.相反,标准差数值越小,代表回报较为稳定,风险亦较小.
例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67.这两组的平均数都是70,但A组的标准差为18.71分,B组的标准差为2.37分(此数据是在R统计软件中运行获得),说明A组学生之间的差距要比B组学生之间的差距大得多.
如是总体(即估算总体方差),根号内除以n(对应excel函数:STDEVP);
如是抽样(即估算样本方差),根号内除以(n-1)(对应excel函数:STDEV);
因为我们大量接触的是样本,所以普遍使用根号内除以(n-1).
公式意义
所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数),再把所得值开根号,所得之数就是这组数据的标准差.
深蓝区域是距平均值小于一个标准差之内的数值范围.在正态分布中,此范围所占比率为全部数值之 68%.根据正态分布,两个标准差之内(深蓝,蓝)的比率合起来为 95%.根据正态分布,正负三个标准差之内(深蓝,蓝,浅蓝)的比率合起来为 99%.