样本方差s²的数学原理深度解析:高中数学中的方差公式探讨
1. 总体方差公式:若总体中有N个数据,分别为X1,X2,...,XN,其中μ为总体均值,则总体方差为sum((Xi-μ)^2)/N,其中,^2表示平方,sum表示求和符号。
2. 样本方差公式:若样本中有n个数据,分别为x1,x2,...,xn,其中x_为样本均值,则样本方差为sum((xi-x_)^2)/(n-1),其中,^2表示平方,sum表示求和符号,n-1为样本自由度。
对于已知两组方差,如果想要求它们的总方差,则需要使用以下公式:总方差= [(n1-1)s1^2+(n2-1)s2^2]/(n1+n2-2),其中,n1和n2分别表示两组数据的样本个数,s1和s2分别表示两组数据的样本方差。这个公式称为“合并方差公式”,用于计算两组数据的总方差。
样本方差s2的公式是s^2=(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2],样本方差是指总体各单位变量值与与其算数平方数的离差平方的平均数。
S称为样本标准差,即方差的算术平方根。由于S与X都是从同一个样本资料中求得,两者的单位相同,故变异系数为一纯数。当两种样本资料所用的单位不只要计算出变异系数,就可以比较它们的变异程度。
公式中的x_为样本均值。先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数,即为样本的均值。均值是指在一组数据中所有数据之和再除以数据的个数。
在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。
一般情况下求D(S^2)并不容易,但如果总体服从正态分布N(μ,σ^2),则(n-1)S^2/σ^2服从自由度为n-1的卡方分布,从而D[(n-1)S^2/σ^2]=2(n-1),可由此间接求出D(S^2)。
如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。可以看出,估计的方差趋于零。在Kenney and Keeping(1951:164),Rose和Smith(2002:264)和Weisstein(n.d.)中给出了渐近等效的公式。
正态总体的样本均值和样本方差相互独立。方差刻画了随机变量的取值对于其数学期望的离散程度。(标准差、方差越大,离散程度越大)
D(X)是刻画X取值分散程度的一个量,它是衡量取值分散程度的一个尺度。若X的取值比较集中,则方差D(X)较小,若X的取值比较分散,则方差D(X)较大。