请问正态分布的分布函数的定义是如何得出的我们知道,正态分布的分布函数,是通过定义得出的,但我不明白人们怎么会知道正态分布的函数就是这个呢,它是如何得到的
请问正态分布的分布函数的定义是如何得出的
我们知道,正态分布的分布函数,是通过定义得出的,但我不明白人们怎么会知道正态分布的函数就是这个呢,它是如何得到的
设某一量的真值为X,在相同的观测条件下对此量进行n次观测,得到的观测值为l1,l2,…,ln,在每次观测中产生的偶然误差(又称“真误差”)为Δ1,Δ2, …Δn,则定义
Δi=X一li,(i=1,2,…,n) (3-1)
从单个偶然误差来看,其符号的正负和数值的大小没有任何规律性.但是,如果观测的次数很多,观察其大量的偶然误差,就能发现隐藏在偶然性下面的必然规律.进行统计的数
量越大,规律性也越明显.下面结合某观测实例,用统计方法进行说明和分析.
在某一测区,在相同的观测条件下共观测了358个三角形的全部内角,由于每个三角形内角之和的真值(180°)为已知,因此,可以按(3-1)式计算每个三角形内角之和的偶然误差Δ(三角形闭合差),将它们分为负误差和正误差,按误差绝对值由小到大排列次序.以误差区间dΔ=3〃进行误差个数k的统计,并计算其相对个数k/n(n=358),k/n 称为误差出现的频率.偶然误差的统计见表3-1.
为了直观地表示偶然误差的正负和大小的分布情况,可以按表3-1的数据作图(图3-1).图中以横坐标表示误差的正负和大小,以纵坐标表示误差出现于各区间的频率(k/n)除以区间(dΔ),每一区间按纵坐标画成矩形小条,则每一小条的面积代表误差出现于该区间的频率,而各小条的面积总和等于1.该图在统计学上称为“频率直方图”.
表3-1 偶然误差的统计
误差区间 dΔ " 负误差 正误差 误差绝对值
K K/n K K/n K K/n
0~3 45 0.126 46 0.128 91 0.254
3~6 40 0.112 41 0.115 81 0.226
6~9 33 0.092 33 0.092 66 0.184
9~12 23 0.064 21 0.059 44 0.123
12~15 17 0.047 16 0.045 33 0.092
15~18 13 0.036 13 0.036 26 0.073
18~21 6 0.017 5 0.014 11 0.031
21~24 4 0.011 2 0.006 6 0.017
24以上 0 0 0 0 0 0
∑ 181 0.505 177 0.495 358 1.000
从表3-1的统计中,可以归纳出偶然误差的特性如下:
(1)在一定观测条件下的有限次观测中,偶然误差的绝对值不会超过一定的限值;
(2)绝对值较小的误差出现的频率大,绝对值较大的误差出现的频率小;
(3)绝对值相等的正、负误差具有大致相等的出现频率;
(4)当观测次数无限增大时,偶然误差的理论平均值趋近于零,即偶然误差具有抵偿性.用公式表示为
(3-2)
式中,[ ]表示取括号中数值的代数和.
图3-1 频率直方图
以上根据358个三角形角度观测值的闭合差画出的误差出现频率直方图,表现为中间高、两边低并向横轴逐渐逼近的对称图形,并不是一种特例,而是统计偶然误差
时出现的普遍规律,并且可以用数学公式来表示.
若误差的个数无限增大(n→∞),同时又无限缩小误差的区间dΔ,则图3-1中各小长条的顶边的折线就逐渐成为一条光滑的曲线.该曲线在概率论中称为“正态分布曲线”或称误差分布曲线,它完整地表示了偶然误差出现的概率P.即当n→∞时,上述误差区间内误差出现的频率趋于稳定,成为误差出现的概率.
正态分布曲线的数学方程式为
(3-3)
式中,圆周率π=3.1416,自然对数的底e=2.7183,σ为标准差,标准差的平方σ2为方差.方差为偶然误差平方的理论平均值:
(3-4)
因此,标准差为
(3-5)
由上式可知,标准差的大小决定于在一定条件下偶然误差出现的绝对值的大小.由于在计算标准差时取各个偶然误差的平方和,因此,当出现有较大绝对值的偶然误差时,在标 准差的数值大小中会得到明显的反映.
以上(3-3)式称为“正态分布的密度函数”,以偶然误差Δ为自变量,以标准差σ为密度函数的唯一参数,σ是曲线拐点的横坐标值.