偏离其他几个测量值较远的数据称为可疑数据。可疑数据产生的原因是试验条件发生了变化,或在实验中出现了过失误差,那未由此产生的测量数据就脱离了正常分布群体。剔除可疑数据,会使测量结果更符合客观实际。然而,正常数据因为偶然误差也会具有一定的分散性,如果为了能够得到精密度好的结果而人为地删去一些误差较大但并非可疑的测量数据,而由此得到精密度很高的测量结果并不符合客观实际。因此,可疑数据的取舍必须遵循一定的原则。试验中一经发现了明显的系统误差和近似误差,就应随时剔除由此而产生的数据。但有时即使实验做完仍不能确知哪些数所是可疑的。这时,对这些可疑数据的取舍应采取统计方法判别,对可疑数据的处理要慎重,只有能找到原因的可疑数据才可做为离群数据来处理,否则应按正常数据处理。
Q检验法:从统计学的观点考虑,确定数据取舍比较严格而使用又方便的是Q检验法。当测定次数n=3~10时,Q检验法是将n次测定的数据从小到大排列为x1,x2,······xi······xn-1,xn。x1为最小可疑数,xn为最大可疑数,根据统计量进行判断,确定可疑值的取舍。统计量Q为:
Q值越大,说明可疑值离群越远。将Q计算值与表5-1中列出的Q0.90比较,若Q计算≥Q0.90,则应舍弃可疑值,否则应予保留。
【例题5-2】测定水平中钙的含量(mg/L),平行测定5次的数据分别为22.36、22.38、22.35、22.40、22.44。试用Q检验法确定22.44是否舍去。