
2.3 有限数据的统计处理
随机误差分布的规律给数据处理提供了理论基础,但它是对无限多次而言。而实际测定只能是有限次。数据处理的任务是通过对有限次测量数据合理的分析,对总体作出科学的论断,其中包括对总体参数的估计和对它的统计检验。
2.3.1 t分布曲线
在实际工作中,测定次数一般不多,总体标准偏差σ是不知道的,仅知道它的估计值s。因此,只能用样本标准偏差s代替总体标准偏差σ,这必然引起正态分布的偏离。为补偿这一误差,可用t分布来处理。t分布是英国统计学家兼化学家Gosset提出来的,他当时用笔名“Student”发表论文,故称其为t分布。t定义为:
(2-21)
此时随机误差不是正态分布,而是t分布。t分布曲线的纵坐标是概率密度,横坐标是t。图2-4为t分布曲线。

图2-4 t分布曲线
由图可见,t分布曲线与正态分布曲线相似,即t分布的横坐标用统计量t代替u。t分布曲线随自由度f而改变。当f趋于∞时,t分布就趋近于正态分布,t分布曲线下一定区间内的面积,就是某区间内的测量值或随机误差出现的概率。此概率称为置信度,用P表示,它表示在某一t值时,测定值落在(μ±ts)范围内的概率。落在此范围之外的概率为(1-P),称为显著性水平,用α表示。
t分布曲线形状随t值而改变,还与f值有关。不同f值及概率所对应的t值已计算出来。表2-1列出了常用的部分值。由于t分值与置信度及自由度有关,故一般表示为tα,f。
表2-1 tα,f分布表

由表可见,当f→∞时,s→σ,t即u。实际上,f=20时,t与u已很接近。
2.3.2 平均值的置信区间
平均值的置信区间,是指在一定置信度下,以平均值为中心,包括总体平均值μ的范围。用样本平均值来表示的置信区间,可按t的定义式给出:
(2-22)
样本平均值的置信区间一般就称为平均值的置信区间。
对于置信区间的概念应正确理解。例如,μ=57.50%±0.10%(置信度为95%),它表示在57.50%±0.10%的区间内包括总体平均值μ的概率为95%,不能说μ落在某一区间的概率为多少,因为μ是客观存在的,没有随机性。一般将置信度定在95%或90%。置信度越高,置信区间就越大,即所估计的区间包括真值的可能性就越大,可由下例看出。
例2-2 对某未知试样中Cl-的质量分数进行测定,5次测定结果为:1.11%,1.12%,1.16%,1.12%,1.15%。计算置信度为90%、95%和99%时,总体平均值μ的置信区间。
解 计算得
查表2-1得,当P=90%时,t0.10,4=2.13
同理,当P=95%时,t0.05,4=2.78,μ=1.13%±0.027%
当P=99%时,t0.01,4=4.60,μ=1.13%±0.045%
从本例可以看出,置信度越高,置信区间就越大。
2.3.3 显著性检验
在定量分析中,经常会遇到这样一些问题:同一分析人员对标准试样进行多次测定后其平均值与标准值不完全一致;当采用不同的分析方法对同一试样进行分析测定得到的结果不完全相符;或不同分析人员或不同实验室对同一试样进行分析时,得到的结果存在较大的差异。这就需要我们判断这些差异(误差)是由系统误差引起的,还是由随机误差引起的,从而消除或减小误差,提高分析结果的准确度。如果分析结果之间存在明显的系统误差,则认为它们之间存在“显著性差异”,反之,就认为没有“显著性差异”,而是由随机误差引起的,认为是正常的误差。因此,显著性检验就是利用数理统计方法来检验分析结果之间是否存在显著性差异。其最常用、最重要的方法是t检验和F检验。
2.3.3.1 t检验法
(1)平均值和标准值比较 在定量分析中,为了检验分析方法或操作过程中是否存在较大的系统误差,可计算出一定置信度下的t值,并与表2-1中的统计值t进行比较,即可作出判断,分析结果的平均值与标准试样的标准值是否存在显著性差异,故称为t检验法。其检验方法如下。
①在一定置信度下,平均值的置信区间为:
则有:
(2-23)
②根据上式计算出t值,并与表2-1中的t值(t表)进行比较:
当t>t表时,存在显著性差异;当t<t表时,不存在显著性差异。
在分析化学中,常采用95%的置信度。
例2-3 现采用某种新方法测定胆矾中铜的质量分数,得到7次分析结果,分别为:25.43%,25.45%,25.46%,25.47%,25.50%,25.46%,25.52%。已知胆矾中铜含量的标准值为25.46%。试判断此新方法是否存在系统误差(置信度为95%)。
解 已知:n=7,f=7-1=6
则
当P=0.95,f=6时,查表得t表=2.45,t<t表,故与μ之间不存在显著性差异,此新方法没有引起明显的系统误差。
(2)两组平均值的比较 同一分析人员采用不同分析方法或不同分析人员分析同一试样时,所得到的平均值常常是不完全相同,当遇到此种情况时,也可采用t检验法判断其平均值之间是否存在显著性差异,其检验方法如下。
设有两组分析数据分别为:n1,s1,和n2,s2,
。它们之间是否存在系统误差,可用下式判断。
(2-24)
上式中s称为合并标准偏差。可由下式求出:
(2-25)
在一定置信度下,总自由度f=n1+n2-2时,查出表2-1的t表值,当t>t表时,两组平均值存在显著性差异;t<t表时,则不存在显著性差异。
2.3.3.2 F检验法
F检验法是通过比较两组数据的方差(s2)之比来判断两组数据的精密度是否存在显著性差异的方法。
统计量F定义为:
(2-26)
式中,为大的方差;
为小的方差。一般来说,如果两组数据的精密度相差很小,则F值趋近于1;若两组数据的精密度相差较大时,F值就较大。置信度为95%时的F值见表2-2。
表2-2 置信度95%时的F值

注:f大表示大方差数据的自由度;f小表示小方差数据的自由度。
可将计算的F值与表2-2所列的F值(F表)进行比较。即在一定置信度下,当F>F表时,则认为它们之间存在显著性差异;反之,不存在显著性差异。
例2-4 用两种不同的方法测定亚铁盐中铁的质量分数,所得结果如下。
第一种方法:14.23% 14.26% 14.24%
第二种方法:14.10% 14.12% 14.08% 14.06%
问在置信度为95%时,两种方法是否存在显著性差异?
解 先进行F检验:
则
查表2-2,f大=3,f小=2,F表=19.16,F<F表。故此两种数据的精密度之间不存在显著性差异。再用t检验法检验。
查表2-1,f=n1+n2-2=5时,t表=2.57,t>t表。故此两种方法之间存在显著性差异,即存在系统误差。必须找出原因,加以解决。
注意,在进行显著性检验之前,对一组测定数据首先必须剔除离群值,才能对一组或多组数据进行显著性检验。通过t检验和F检验,不存在显著的系统误差和随机误差之后的一组测定数据或分析结果,才具有一定的可靠性。下面就离群值的取舍方法进行简单介绍。
2.3.4 离群值的取舍
在进行多次平行测定时,往往有个别数据离群较远,这种数据称为离群值(outlier),又称可疑值。对离群值不能随意取舍,特别是在测定次数较少时,对结果影响较大。取舍时应考虑两个方面的问题:一方面,如果是由于过失造成的误差,此离群值应舍去;另一方面,离群值若并非由“过失误差”引起,则应按一定的统计学方法进行处理。统计学处理离群值的方法很多,下面介绍处理方法较简单的法、Q检验法和效果较好的格鲁布斯(Grubbs)法。
2.3.4.1
法(四倍法)
根据随机误差的正态分布规律,偏差超过3σ的个别测定值的概率小于0.3%,故这一测定值通常可以舍去。而统计学可以证明,当测定次数非常多时,3σ≈4δ,即偏差超过4δ的个别测定值可以舍去。对于少量实验数据,只能用s代替σ,用代替δ,故可粗略地认为,偏差大于
的个别测定值可以舍去。此法较为简单,不必查表,但误差较大。当
法与其他检验法相矛盾时,应以其他法则为准。
用法判断离群值的取舍的方法步骤如下:
①求离群值xD之外的其余数据的平均值和平均偏差
;
②计算偏差和
的值;
③按下式判断离群值xD的取舍。
(2-27)
(2-27a)
2.3.4.2 Q检验法
离群值的取舍的方法步骤如下:
①将一组数据从小到大排列起来:x1,x2,…,xn-1,xn。
②按下式计算舍弃商Q。Q为统计量,定义为:
(2-28)
设xn为离群值时,则
(2-28a)
设x1为离群值时,则
(2-28b)
③将计算出的Q值与表2-3中QP,n统计值相比较,若Q>QP,n,则该离群值应舍去,否则应保留。
表2-3 舍弃商Q表

例2-5 测定某药物中钴的含量(μg·g-1),4次平行测定结果数据如下:
1.25,1.27,1.31,1.40,试问用法和Q检验法(置信度为95%),判断1.40这个数据是否应该保留?
解 (1)用法
首先求离群值xD=1.40之外的其余数据的平均值和平均偏差
:
则
故1.40这个数据应舍去。
(2)Q检验法
已知,n=4,查表2-3,Q0.90=0.76,Q<Q0.90,故1.40这个数据应予保留。
在此例中,法和Q检验法所得的结论不同。这时一般应以Grubbs法进行核准。要求不高时可直接采用Q检验法的结果,因为Q检验法比
法更具有统计意义。
2.3.4.3 格鲁布斯(Grubbs)法
该法的具体步骤如下。
①先将测定的所有数据按照从小到大顺序排列:x1,x2,…,xn-1,xn。其中x1或xn可能是可疑值。
②计算出该组数据的平均值及标准偏差s。
③计算统计量T计:
④根据测定次数n和所要求的置信度,查表2-4 T表,若T计>T表,说明可疑值相对平均值偏离较大,则可疑值舍去,否则可疑值保留。
表2-4 T表

格鲁布斯法最大的优点是在判断可疑值的过程中,引入了正态分布中两个最重要的样本参数平均值及标准偏差s,故方法的准确度较好。这种方法的缺点是需要计算
及s,手续稍麻烦。
例2-6 例2-5中的实验数据用格鲁布斯法判断1.40这个数据是否应保留(置信度95%)?
解
查表2-4,T0.95=1.46,T计<T表,故1.40这个数据应该保留。此结论与例2-5中用法判断所得结论不同。在这种情况下,一般取格鲁布斯法的结论,因这种方法的可靠性较高。