5.2 分析结果的误差
5.2.1 误差产生的原因与分类
定量分析的目的是通过实验确定试样中被测组分的量。但由于受分析方法、测量仪器、试剂和分析人员主客观因素等方面的限制,使得测量值不可能与真实值完全一致。分析结果与真实值之差称为误差(error)。误差是客观存在的,只可能尽量减小,不可能完全消除。依据产生原因的不同,误差可分为系统误差和随机误差两大类。
(1)系统误差
系统误差(systematic error)又称可测误差,是由某种固定、经常性原因引起的具有单向性和重复性的误差,其大小、正负可重复显示,并可测量。系统误差影响分析结果的准确度,它可以通过校正减小或消除。
系统误差产生的原因可由分析方法本身原因引起,如重量分析中沉淀的溶解损失、滴定分析中反应不完全等。也可由于仪器不够精密,如容量器皿刻度不准确、砝码质量不符等。也可由于分析人员操作技术与正确操作技术之间的差别,如分析人员辨别颜色偏深、读取刻度数偏高等均会引起实验分析结果偏高或偏低。
(2)随机误差
随机误差(random error)又称偶然误差,它是由一些偶然原因引起的误差,其大小、正负不定,不能重复显示。引起原因可能由于测量时外界温度、湿度、气压、放置时间等微小的变化。偶然误差影响分析结果的精确度和准确度。很难找到定量的影响因素,它不能通过校正的方法减小或消除。但可以通过增加测定次数,用数理统计方法处理分析结果来减小误差。
(3)过失误差
过失误差(fault error)由于工作中的差错,操作者违反规程而造成,如加错试剂、读错刻度,此数据应在处理分析结果前舍去。
(4)公差
公差(tolerance)为生产部门允许存在的误差。若分析结果超过公差范围称为“超差”,不能采用。公差范围视分析工作对准确度的要求、试样成分、含量不同而规定其范围。
5.2.2 误差的表示方法
(1)误差与准确度
准确度(accuracy)是指测量值与真实值接近的程度。测量值与真值越接近,测量越准确。误差是衡量测量准确度高低的尺度,有绝对误差(absolute error)和相对误差(relative error)两种表示方法。
绝对误差是测量值与真值之差。若以x代表测量值,以μ代表真值,则绝对误差δ为:
(5-2)
绝对误差以测量值的单位为单位,误差可正可负。误差的绝对值越小,测量值越接近于真值,测量的准确度就越高。
相对误差是绝对误差δ与真值μ的比值,表示如下:
(5-3)
相对误差反映了误差在测量结果中所占的比例,它同样可正可负,但无单位。在比较各种情况下测量值的准确度时,相对误差更为合理。
【例题5-1】 用分析天平称量两个试样,一个是0.0021g,另一个是0.5432g。两个测量值的绝对误差都是0.0001g,试计算相对误差。
解 前一个测量值的相对误差为:
后—个测量值的相对误差为:
可见,当测量值的绝对误差恒定时,测定的试样量越高,相对误差就越小,准确度越高;反之,则准确度越低。因此,对常量分析的相对误差应要求严格,而对微量分析的相对误差可以允许大些。例如,用重量法或滴定法进行常量分析时,允许的相对误差仅为千分之几;而用光谱法、色谱法等仪器分析法进行微量分析时,允许的相对误差可为百分之几,甚至更高。
(2)偏差与精密度
①精密度(precision) 是平行测量的各测量值之间互相接近的程度。各测量值间越接近,测量的精密度越高。精密度的高低用偏差来衡量。偏差表示数据的离散程度,偏差越大,数据越分散,精密度越低。反之,偏差越小,数据越集中,精密度就越高。偏差有以下几种表示方法。
②绝对偏差(deviation) 单个测量值与测量平均值之差称为绝对偏差,其值可正可负。若令代表一组平行测量的平均值,则单个测量值xi的偏差d为:
(5-4)
③平均偏差(average deviation) 各单个偏差绝对值的平均值,称为平均偏差,以d表示:
(5-5)
式中,n表示测量次数。平均偏差均为正值。
④相对平均偏差(relative average deviation) 平均偏差与测量平均值的比值称为相对平均偏差,定义如下式:
(5-6)
⑤标准偏差(standard deviation; s) 在平均偏差和相对平均偏差的计算过程中忽略了个别较大偏差对测定结果重复性的影响,而采用标准偏差则可以突出较大偏差的影响。对少量测定值(n≤20)而言,其标准偏差的定义式如下:
(5-7)
⑥相对标准偏差(relative standard deviation;RSD) 标准偏差s与测量平均值的比值称为相对标准偏差,也称为变异系数(coefficient of variation; CV),定义如下式:
(5-8)
在实际工作中多用RSD表示分析结果的精密度。
【例题5-2】 四次标定某溶液的浓度,结果(mol·L-1)为0.2041、0.2049、0.2039和0.2043 。计算测定结果的平均值,平均偏差,相对平均偏差,标准偏差及相对标准偏差。
解
(3)重复性与重现性
重复性(repeatability)和重现性(reproducibility)均反映了测定结果的精密度,但二者具有不同概念。重复性是指在同样操作条件下,在较短的时间间隔内,由同一分析人员对同一试样测定所得结果的接近程度;重现性系指在不同实验室之间,由不同分析人员对同一试样测定结果的接近程度。要将分析方法确定为法定标准(如药典)时,应进行重现性试验。
5.2.3 准确度与精密度的关系
准确度与精密度的概念不同。当有真值(或标准值)作比较时,它们从不同侧面反映了分析结果的可靠性。准确度表示测量结果的正确性,精密度表示测量结果的重复性或重现性。
图5-1表示甲、乙、丙、丁四人测定同一试样中某组分含量时所得的结果。每人均测定六次。试样的真实含量为10.0%。由图5-1可见,甲所得结果的精密度虽然很高,但准确度较低;乙的精密度和准确度均好,结果可靠;丙的精密度很差,其平均值虽然接近真值,但这是由于大的正负误差相互抵消的结果,纯属偶然,并不可取;丁所得结果的精密度和准确度都不好。由此可见,精密度是保证准确度的先决条件,精密度差,所得结果不可靠。但高的精密度不一定能保证高的准确度,因为可能存在系统误差(如甲的结果)。总之,只有精密度与准确度都高的测量值才是可取的。
图5-1 定量分析中的准确度与精密度
由于通常真值是未知的,如果消除或校正了系统误差,精密度高的有限次测量的平均值就接近于真值μ。因此常常根据测定结果的精密度来衡量测定结果是否可靠。
5.2.4 提高分析结果准确度的方法
要想得到准确的分析结果,必须设法减免在分析过程中带来的各种误差。减免分析误差的主要方法包括下面几种。
(1)选择恰当的分析方法
不同分析方法的灵敏度和准确度不同。化学分析法的灵敏度虽然不高,但对常量组分的测定能获得比较准确的分析结果(相对误差≤0.2%),而对微量或痕量组分的测定灵敏度难以达到。仪器分析法灵敏度高、绝对误差小,虽然其相对误差较大,不适合于常量组分的测定,但能满足微量或痕量组分测定准确度的要求。另外,选择分析方法时还应考虑共存物质的干扰。总之,应根据分析对象、样品情况及对分析结果的要求,选择恰当的分析方法。
(2)减小系统误差
检验分析结果的准确度可用来检验方法的可靠性和校正分析结果。验证方法有:做空白试验和对照实验。用蒸馏水或已知准确含量的标样代替试样在同一条件下测量,选用公认的标准分析方法与采用的分析方法对照;也可用标准加入回收法,判断分析结果的可靠性。实验前对仪器校正、对选用的分析方法校正,都能减小系统误差,从而提高分析结果的准确度。
(3)减小偶然误差
增加测定次数,分析结果分布应符合统计规律,即正误差和负误差出现的概率相等,小误差出现的次数多,大误差出现的次数少,特别大的误差出现次数极少。虽然偶然误差在分析操作过程中无法避免,但在消除了系统误差的基础上,增加测定次数和细心操作可以减小偶然误差。
(4)回归分析法
回归分析法是减小测量误差最常用的数学方法。在分析化学特别是仪器分析中,由于测量仪器本身的精密度及测量条件的微小变化,即使同一浓度的溶液,两次测量结果也不完全一致。以分光光度法为例,标准溶液的浓度c与吸光度A之间的关系,在一定范围内,可以用直线方程描述,即比耳定律。但在实际测量中,由于误差的存在,各测量点对于以比耳定律为基础所建立的直线,往往会有一定的偏离。这就需要用数理统计的方法找到一条最接近于各测量点的直线,它对所有测量点来说误差是最小的。如何得到这条直线?如何估计直线上各点的精密度以及数据间的相关性?对数据进行回归分析是较好的选择。这里介绍最简单的一元线性回归,适用于单一组分测定的线性校正模式。
回归直线可用方程表示:
y=a+bx
式中,a为直线的截距;b为直线的斜率。
设作标准曲线时取n个实验点(x1,y1),(x2,y2),…,(xn,yn),则每个实验点与回归直线的误差可用Qi=来定量描述。回归直线与所有实验点的误差即为:
(5-9)
要使所确定的回归方程和回归直线最接近实验点的真实分布状态,则Q必然取极小值。用数学上求极值的方法,即有,可推出a和b的计算式:
(5-10)
(5-11)
式中,、分别为x和y的平均值。当直线的截距a和斜率b确定后,一元线性回归方程(regression equation)和回归直线就确定了。
在实际工作中,当两个变量间并不是严格的线性关系,数据的偏离较严重时,虽然也可以求得一条回归直线,但这条直线是否有意义,可用相关系数(correlation coefficient,r)来检验。相关系数的定义为:
(5-12)
相关系数的物理意义如下:
①当两个变量之间存在完全的线性关系,所有yi值都在回归线上时,r=1。
②当两个变量y与x之间完全不存在线性关系时,r=0。
③当r值在0~1之间,表示y与x之间存在相关性。r值越接近1,线性关系越好。
思考题5-1 导致误差产生的原因有哪些?误差的表示方法有哪些?如何减小误差?
思考题5-2 准确度和精密度各指什么?它们之间有什么关联?