资源简介 (共18张PPT)检测数据可疑值取舍1. 可疑值取舍的意义(1)检测分析中,常遇到某一组数据中有个别数据与其他数据相差较大,或者多组分析数据中有个别数据组的均值与其他组相差较大。(2)如果确定这些差异较大的数据是实验条件变化或实验过失造成的,那么这些数据存在会影响分析结果的准确性,且测定次数较少时影响尤为显著,应舍去。(3)如果不能确定是实验条件发生明显变化或实验过失造成的,那么就不能舍弃,否则也会影响测定结果准确性。可疑值取舍2.离群值、可疑值和正常值(1)可疑值:怀疑与其他测定数据有较大差异,但尚未证实与其他测定数据间存在系统误差的测定数据是可疑数据或可疑值。(2)正常值:不能证明与其他测定数据存在系统误差的可疑值是正常值。(3)离群值:经过统计检验,与其他测定数据存在系统误差的可疑值是离群值。可疑值取舍3.可疑值取舍及依据(1)取舍方法:可疑值取舍不可随意进行,而用数理统计方法进行检验,判定为离群值的应舍弃,否则应视为正常值而保留。(2)检验方法:①Dixon检验法:适用于一组测量值的一致性检验和离群值剔除.②Grubbs检验法:适用于检验多组测量值均值的一致性和剔除多组测量值中的离群均值,也可用于检验一组测量值一致性和剔除一组测量值中的离群值。可疑值取舍4. Dixon检验法Dixon(Q)检验法步骤如下:(1)将测得数据由小到大排列,如x1、x2、x3、…xn。其中x1和xn分别是最小可疑值和最大可疑值。(2)根据测定次数n按照下表计算式计算Q值。可疑值取舍Dixon 检验法步骤(2)根据测定次数n按照下表计算式计算Q值。Dixon 检验统计量Q计算公式可疑值取舍(3)根据给定的显著性水平(α)和样本的测定次数(n),再在表4.4Dixon检验临界值表中查得临界值(Qα):Dixon 检验法步骤可疑值取舍(4)判断:若Q≤ Q0.05 ,则可疑值为正常值;若Q 0.05若Q>Q0.01 ,则可疑值为离群值。Dixon 检验法步骤可疑值取舍例1:某一试样的10次测量值分别为:15.48%15.51%、15.52%、15.53%、15.52%、15.56%、15.68%、15.56%,试用Q检验法检验15.48%和15.68%是否为离群值。Dixon 检验法案例分析可疑值取舍解:(1)将各测定值按从小到大的顺序排列:(2)检验最小值15.48%是否为离群值。查表4.3知n=10时Q值的计算公式,并计算Q值:(3)查表4.4,当n=10,给定显著性水平α=0.05时,Q0.05=0.477。(4)因为Q=0.375<Q0.05=0.477,故最小值15.48%为正常值,应保留。Dixon 检验法案例分析可疑值取舍(5)同理,检验最大值15.68%是否为离群值,n=10,根据表4.3公式计算Q值。查表4.3得如下公式:查有4.4,当n=10,给定显著性水平α=0.01时,Q0.01=0.597。由于计算Q=0.706>Q0.01=0.597,故最大值15.68%为离群值,应剔除。Dixon 检验法案例分析可疑值取舍Dixon检验法(Q检验法)的缺点是没有充分利用测定数据,仅将可疑值与相邻数据比较,可靠性差。在测定次数少时,如3~5次测定,误将可疑值判为正常值的可能性较大。Q检验法可以重复检验至无其他可疑值内止。但要注意Q检验法检验公式,随n不同略有差异。在使用时应注意不要混淆。可疑值取舍5. Grubbs检验法Grubbs检验法也称作T检验法,适用于检验多组测量值均值的一致性和剔除多组测量值中的离群均值,也可用于检验一组测量值一致性和剔除一组测量值中的离群值。Grubbs检验法一般步骤如下:可疑值取舍Grubbs检验法步骤(1)将个数据按大小顺序排列:X1、X2、X3、……Xn,将其中最大值记为Xmax,最小值记为Xmin。(2)计算这组数据的算术平均值X和标准偏差S。(3)为判断最大值Xmax和最小值Xmin是否可疑,分别计算其T值: 或可疑值取舍(4)根据测定次数n(或测定值组数l)和给定的显著性水平α,查表4.5得T的临界值Tа。Grubbs检验法步骤可疑值取舍(5)比较计算的T和临界值Tα,若T≤T0.01,则可疑值为正常值,应予保留;若T0.01<T≤T0.01,则可疑值为偏离值;若T>T0.01,则可疑值为离群值,应予删除。(6)在第一个异常数据剔除舍弃后,如果仍有可疑数据需要判别时,则应重新计算x和s,求出新的T值,再次检验,依此类推,直到无异常的离群数据为止。Grubbs检验法步骤可疑值取舍Grubbs检验法案例分析例2:10个实验室分析同一样品,各实验室5次测定的平均值按大小顺序为4.41、4.49、4.50、4.51、4.64、4.75、4.81、4.95、5.01、5.39,用T检验法检验最大均值5.39是否为离群均值?可疑值取舍解 :要判断xmax=5.39在这组数据中是否为离群值,可先将其代入下式计算T值:其中所以查表4.5知,n=10,α=0.05时,T0.01=2.176。由于T=2.10,10<T0.01=2.176,故5.39为正常值,应予以保留。可疑值取舍 展开更多...... 收起↑ 资源预览