(二)回收试验
回收试验用于评估试验方法准确测定加入纯分析物的能力,结果用回收率表示。该试验可以检测试验方法的比例系统误差,并可有助于校正物的定值。
(1)加标体积:加入的标准液体积要尽可能少,使回收样本的基质成份与原始样本接近,一般加标体积在总体积的10%以内。
(2)吸量准确:因加入分析物的浓度值是根据加入标准液体积及原样本的体积计算而得,吸量是否准确直接影响回收结果的准确性,应选择经校正的吸样器并按规范要求操作吸量。
(3)加入待测物的浓度:在保证总浓度在方法分析测量范围内,最好使加标后的样本中被测物浓度达到医学决定水平。如:正常血糖浓度在3.9 ~ 6.2mmol/L, 如果加入2.8 mmol/L 葡萄糖,可使回收样本浓度达6.7 ~ 9.0 mmol/L,此范围正是解释血糖结果的关键水平。
(4)标准液浓度:因加标体积占总体积的10%以内,即标准液将被稀释约10倍,配制的标准液浓度应为回收浓度的10倍。例如患者样本葡萄糖浓度为3.5mmol/L,加入适量标准液后使其达到7.0mmol/L,欲使0.9ml患者样本加入0.1ml标准液后增加3.5mmol/L,应配35mmol/L的标准液。
(5)重复测定:为了减少随机误差的干扰,每一个样本通常重复测定2 ~ 3次;一般须作高、中、低不同浓度的回收试验,分别计算各浓度的平均回收率。
(6)计算比例系统误差:比例系统误差 = 100% - 平均回收率
3.可接受性判断 将比例系统误差的大小与CLIA规定的TEa标准(同表3-4)进行比较,若小于TEa即可接受。
4.范例 某法测定血清钙回收率:
(1)样本制备:① 基础样本:血清1ml+蒸馏水0.1 ml。
② 回收样本1:血清1ml+5.0 mmol/L钙标准液0.1ml。
回收样本2:血清1ml+10.0 mmol/L钙标准液0.1ml。
(2)按表3-5填入结果:
表3-5 回收试验检测结果
测定浓度(mmol/L) 加入浓度(mmol/L)回收浓度mmol/L 回收率(%) |
基础样本 |
2.45 |
— |
— |
— |
分析样本1 |
2.87 |
0.45 |
0.42 |
93.3 |
分析样本2 |
3.32 |
0.91 |
0.87 |
95.6 |
(三)干扰试验
干扰试验是通过定量检测样本中的物质所引起试验方法的系统误差,以评价方法的准确度。由干扰物质引起的误差通常是恒定系统误差,与分析物的浓度无关系。
1.基本步骤 见流程图3-12
2.试验要点
(1)试验样本:标准溶液或患者样本均可作为干扰试验的样本,由于患者样本来源方便、基质成份同实际样本,常选择患者样本作为试验样本。
(2)加入干扰物的体积:加入干扰物的体积要尽可能小,以减少稀释。
(3)吸量精确:吸量的精密度要尽可能高,以保证干扰样本和基础样本的体积一致。
(4)干扰物的浓度:加入干扰物的浓度须达到有价值的水平,尽可能达到病理样本的最高浓度值。如:氧化酶法测定血糖受到维生素C的干扰,血液中0.85mmol/L的维生素C是其最高浓度值,因此,加入维生素C的浓度应为0.85mmol/L。在确定某物质对分析方法有干扰后,进一步测定在何种水平上产生的误差在临床上无意义,即确定不影响临床应用价值的最低可疑物浓度值。
(5)可疑干扰物的选择:可根据方法的反应原理、干扰物数据库、厂家建议和文献提示选择可能的干扰物。一般考虑的干扰因素包括胆红素、溶血、脂血、防腐剂、抗凝剂、某些药物和食物成分等。加入胆红素标准制备胆红素血、机械溶血制备溶血样本、加入脂肪标准制备脂血样本或对高脂样本超速离心前后对比等进行干扰试验。
(6)重复次数:每个样本通常重复测定2 ~ 3次。
(7)计算干扰值:干扰值= 干扰样本测得值 - 基础样本测得值
3.可接受性判断 将干扰引起系统误差的大小与CLIA规定的PT TEa(同表4-1)进行比较,若小于TEa即可接受。如:0.85mmol/L 维生素C对氧化酶法测定血糖的平均干扰值为0.7 mmol/L,CLIA规定的血糖PT的TEa为10%,若血糖上限为6.1 mmol/L,则可允许0.6 mmol/L的误差。因此,维生素C对氧化酶法测定血糖所产生的干扰不可接受。
(四)小结
1.方法比较试验 用以评价试验方法的恒定和比例系统误差。
(1)选择40例患者样本,其浓度覆盖整个分析范围;
(2)每天在2小时内用试验和比较方法测定8份样本,连续测定5天;
(3)作图初步分析;
(4)重新测定结果差异大的样本;
(5)收集数据,进行相关回归分析,如r ≥ 0.99,可根据回归方程估计
在医学决定水平的系统误差或随机误差;如r < 0.99,通过t检验估计两方法在平均水平的偏差;
(6)结合系统和随机误差,通过与TEa比较,或使用方法决定图,作出总误差的可接受性判断。
2.回收试验和干扰试验 回收试验用以评价方法的比例系统误差,干扰试验用以评价方法的恒定系统误差。回收和干扰试验可作为比较试验的替代方法,以评价试验方法的系统误差。
(1)回收和干扰试验的技术方法相同,均是在基础样本中加入一定量的标准物,但所加入的物质不同:回收试验中加入的是待测物标准,干扰试验中加入的是可疑干扰物。
(2)数据处理不同 计算配对样本测定结果之差得到干扰值,即恒定系统误差;计算平均回收率得到比例系统误差。
(3)与TEa比较,做出误差的可接受性判断。
(五)A Deeper Look
1.实验室不仅要对新建方法进行评价,还应对新使用的方法(即使厂家已提供了性能指标)或分析条件发生了变化(如:更换了试剂、仪器进行了大修、操作规程改变等)的方法进行性能评估,以确认性能满足要求。
2.按照美国临床实验室修正案(clinical laboratory improvement amendment, CLIA)要求,某些性能指标在评价之后,每年还要验证两次,如:线性范围、方法性能比较等。
3.根据试验方法的复杂程度按照一定的程序进行方法性能评价。试验方法的分类和标准化的评价程序可参考CLIA的规则和临床实验室标准化研究所(Clinical and Laboratory Standards Institute,CLSI)的有关文件。
(一)重复性试验
重复性试验(replication experiment)的方法是将同一材料分成数份试验
样本,进行多次分析测定(一般为20次),其目的在于评价或验证试验方法的随机误差或不精密度。用于描述与时间相关的不精密度的试验包括批内重复性试验、日内重复性试验和日间重复性试验等。
1. 基本方法
2. 试验要点
(1)试验样本的选择:标准液、控制物溶液、患者样本或混合血清均可用
于精密度评价,视其用途而定。①标准液简便易得,可制成不同浓度,干扰因素少,可作为评价随机误差的最佳样品;②冻干质控物稳定、使用方便,适用于进行日间重复性试验。但应注意质控血清与患者血清不一样,加入的稳定剂、防腐剂可能干扰某些成份的测定,反复冻融亦会对试验结果有影响;③患者样本或混合血清常用于短时间内完成的试验,如批内和日内的重复性试验,使用时应详细记录样本的特性,如混浊、溶血、药物等。
(2)分析物浓度的选择:进行重复性试验的被测物浓度宜选择在医学上具有决定性意义的浓度水平,通常选择低、中、高三个水平的试验样本。
(3)试验样本数量:在试验周期内至少作20个样本的检测。增加样本量有利于更好的评价随机误差,但是同时会增加成本和试验时间。最佳方案是在成本和试验周期允许的范围内尽可能多的增加样本量。
(4)试验条件:要尽量在相同的条件下,包括测量程序、人员、仪器、环境等,以及在测量条件保持不变的时间段内完成。
根据以上公式,可分别得到批内、日内和日间均数、标准差和变异系数。
4.性能可接受性判断 将计算得到的标准差与CLIA规定的TEa(同表3-4)进行比较,判断其不精密度是否可接受。
(1)短期试验的不精密度评价:批内或日内的标准差(s)应小于或等于CLIA规定的TEa的1/4,即:sw-run or sw-day ≤ 1/4 TEa。
(2)长期试验的不精密度评价:总的标准差(stot)应小于或等于CLIA规定的TEa的1/3,即:stot ≤ 1/3 TEa。
(3)方法决定图(method decision chart, MDC):重复性试验得到的随机误差(RE)和准确度试验得到的系统误差(SE),构成了试验方法的总误差(TE),利用方法决定图可判断方法的性能。
5.方法决定图
(1)方法决定图的意义:方法性能最重要的是不精密度和不准确度,而方法应用者难以区别误差类别,更关心的是方法误差所造成的后果。此误差即总误差,包括了不精密度和不准确度,随机误差可由重复实验估计,得到方法的不精密度;系统误差可由方法比较实验所得到的试验方法和比较方法结果的均值间偏倚,或者由回归方程计算某特定医学决定水平处的偏倚估计,得到方法的不准确度。由此可计算得到总误差的大小,或应用Westgard的方法决定图(MD图),将不准确度(或偏倚)和不精密度在坐标图上表达,其结合点即总误差。将其与要求的质量作比较,从图上可判断方法性能。在决定图上,Westgard将方法性能分为四种:不符要求性能、临界性能、良好性能、优秀性能。
(2)方法决定图的制作:取坐标纸,按以下步骤作图:
1)确定分析质量要求,以TEa表示。将TEa表示为某决定水平浓度或靶值的百分数(%)。
2)在坐标纸上标记Y轴为允许不准确度(偏倚%),从0到TEa;X轴为允许不精密度(%,即CV),从0到0.5 TEa。
3)从Y轴的TEa到X轴的0.5 TEa画一条直线(0,TEa;0.5 TEa,0),该线为偏倚+2S线;从Y的TEa到X的0.33 TEa画一条直线(0,TEa;0.33 TEa,0),该线为偏倚+3S线;从Y的TEa到X的0.25 TEa画一条直线(0,TEa;0.25 TEa,0),该线为偏倚+4S线。这几条线分别划分出了四个性能区域,即性能差(poor performance)、临界(marginal performance)、良好(good performance)和优秀(excellence performance)。TEa以10%为例,如图3-13所示。
4)评价试验所得到的不准确度(或偏倚)和不精密度的交点在坐标图上的位置即是该方法性能。
图3-13 方法性能决定图
(3)方法决定图的解释:使用MD 图时,将方法的误差表示为决定水平浓度或靶值的百分值。在X轴上点出不精密度的估计值(从批内和天间试验得到),在Y轴上点出不准确度的估计值(从方法学比较试验得到)。
1)从数学函数关系分析,通过偏倚TEa – 不精密度0.5TEa(+2s)线是确定方法性能的最低限。①如果试验方法的性能点在该线的上方,说明方法的总误差水平超过了TEa要求,方法性能不可接受;②如果试验方法性能点在该线上,表示方法的总误差等于TEa水平,方法性能处于临界水平的起点;
2)通过偏倚TEa – 不精密度0.33TEa(+3s)线是区分方法性能属临界还是良好的界线。①方法性能点处于偏倚+2s线和偏倚+3s线的区域(包括在偏倚+3s线上的),说明方法的总误差小于偏倚+2s,但仍然大于或等于偏倚+3s水平,这样的方法性能属于临界水平,方法在实际应用时对质量控制要求很高;②方法性能点处于偏倚+3s和偏倚+4s线的区域(包括在偏倚+4s线上的),说明方法的总误差小于偏倚+3s水平,但仍然大于或等于偏倚+4s水平,这样的方法性能属良好,该方法可在一定程度容忍实际使用中不稳定引起的误差;③方法性能点处在偏倚+4s线以下,说明方法的总误差小于偏倚+4s水平,方法性能属优秀,这类方法在实际应用时很容易控制。
(4)应用示例
1)示例1:某测定白蛋白的方法,测定值35g/L处的CV为2.0%,偏倚为0%;CLIA的质量要求是10%; X取2.0%,Y为0.0%,即图中的“1”点,如图3-14所示。因此它在方法性能决定图上的性能点位置清楚说明方法的性能属于优秀,该试验方法在常规应用中很易控制。
2)示例2:某测定血糖的方法,测定值7.0mmol/L处的CV为2.0%,偏倚为2.0%;当葡萄糖含量超过5.6mmol/L的时候,CLIA的质量要求也是10%,因此可以使用同一个方法性能决定图。该方法的性能点X取2.0%,Y为2.0%,即图中的“2”点。性能点位于良好区,方法性能可接受。此方法在日常应用中对质量控制要求较高,如同时用4个控制物(N=4)的多规则控制方法,才能保证要求的质量。
3)示例3:某测定胆固醇的方法,测定值在5.17mmol/L处的CV为3.0%,偏倚为3.0%。取X为3.0%,Y为3.0%,在方法性能决定图上点出性能点“3”,性能点的位置在临界性能区。对于这类方法,如能保证分析各环节的规范化操作,采用更多的质控方案,质量可以符合要求。
4)示例4:某测定葡萄糖的方法,测定值在6.6mmol/L处的CV为4.0%,偏倚为3.0%。当葡萄糖含量超过5.6mmol/L的时候,CLIA的质量要求也是10%。取X为4.0%,Y为3.0%,此方法的性能点为图中的“4”点。性能点位于性能不符合要求区,此方法不能用于临床常规检验。
图3-14 方法性能决定图应用示例
(二)小结
1.精密度评价时,实际测定的是不精密度,反应测定结果随机误差的大小。
2.重复性试验是评价或验证试验方法随机误差的常用试验,其结果通过计算均数( )、标准差(s)和变异系数(CV)来表示。
3.重复性试验评价的随机误差(RE)和方法比较试验评价的系统误差(SE)构成试验方法的总误差(TE),它们对方法学评价的意义如图3-13。横坐标(X)为可接受的不精密度,用标准差(s)的百分数表示,纵坐标(Y)为可接受的不准确度,用偏差( )的百分数表示。
4.由评价试验得到的某浓度水平(常是医学决定水平)的不精密度和不准确度(偏差%),在MD图上找到方法性能点,可对方法作出性能差、临界性能、良好性能和优秀性能的判断。
(三)A Deeper Look
精密度要求较高的试验方案,需要对短期和长期试验的变量因素提供更详细的信息。可参考临床实验室标准化研究所(CLSI)推荐的标准进行方案设计,使用变量分析(ANOVA)统计工具进行评估。
六、检测限的评价
检测限(limit of detection)是指检测系统可检测出的最低分析物浓度,此浓度限值对于要求准确定量体液中的某些低浓度物质,如:毒物、肿瘤标志物等的检测特别重要。通过检测限试验(detection limit experiment)可确定某检测系统/方法的检测限,包括检测低限、生物监测限和功能敏感度。
(一)检测限试验
检测限试验(detection limit experiment)用于评价检测系统可检测出的
最低分析物浓度。
1.试验样本 一般制备两种不同类型的样本。
(1)空白样本:即不含有待分析物的样本,常使用系列参考物中的“零标准”作为空白,理想的空白样本应和所检测的患者样本具有相同的基质。
(2)检测限样本:在空白样本中加入一定量的分析物配制成检测限样本,使其浓度达预期或厂家推荐的检测限浓度,通常要在预期检测限浓度附近制备几份不同浓度的检测限样本。对于某些项目,可使用某疾病已治愈的患者样本,如:前列腺特异抗原(PSA)的检测限样本,可使用前列腺癌治疗后的患者血清。
2.测定次数 对于样本的重复检测次数并无具体的规定,一般测定10 ~ 20次。
3.试验时间 如果从空白样本的重复性了解检测低限,常常做批内重复性或短期试验;如果从检测限样本的重复性了解检测低限,推荐做较长时间的重复性试验来评价日间的检测性能,一般做10次或10天检测。
4.结果计算 有三种表示检测限的术语,即检测低限,生物监测限和功能灵敏度。
(1)检测低限(lower limit of detection, LLD):检测限试验结果中,空白样本测定均值加2(或3)倍标准差(空白样本),即:
95%可能性: LLD = 空白 + 2s空白
99.7%可能性: LLD = 空白 + 3s空白
检测低限反映了方法对空白样本测定的不确定度。需注意,直接读出浓度的检测系统对低于零的检测将报告为零,其分布不是正态分布,因此计算的标准差不能如实表达检测低限的真实情况。如果检测响应以初始值表示,如:吸光度、荧光等,此时计算的标准差有效。所以应使用初始响应值来计算均值和标准差,然后再转换成浓度单位。如测定结果小于或等于检测低限,报告为“无某待测物检出”。
(2)生物检测限(biologic limit of detection, BLD):检测低限加2(或3)倍标准差(检测限样本),即:
95%可能性: BLD = LLD + 2s检测限样本
99.7%可能性: BLD = LLD + 3s检测限样本
生物检测限更真实地反映实际检测限浓度水平样本测定的不确定度。
检测限试验及其结果计算如图3-16所示。
(3)功能灵敏度(functional sensitivity, FS):重复测定变异系数为CV 20%的检测限样本浓度,即在预期检测限附近几份不同浓度的样本重复性试验测定结果中,变异系数为CV20%的检测限样本浓度为功能灵敏度,功能灵敏度反映了方法能可靠测定的最低浓度。
几种检测限定义的关系见图3-15,检测限试验及其结果计算见图3-16。
|