dxy logo
首页丁香园病例库全部版块
搜索
登录

文献学习:检验医学中的偏倚(Bias)

发布于 02-03 · 浏览 2745 · IP 北京北京
icon子汉 推荐
icon子汉 已点赞

偏倚(Bias)是检验医学中的一个重要概念,我们日常进行的校准、溯源、室内质控、室间质评等质控控制工作,都是在尽量减小偏倚的发生,但根据其定义,偏倚是不会被完全消除的。偏倚是隐蔽的,不容易被临床医生和患者察觉并接受的(被喻为“月球的背面”)。因此,了解偏倚、接受偏倚不仅仅对于临床实验室的工作者,对于医疗过程中的每个参与者都有重要意义!

偏倚是实验室检测结果与实际值的系统性偏差,其会导致误诊或对疾病预后的误判,并增加医疗成本。正确估计和纠正偏倚有助于减少实验室错误,提高患者安全,并大大降低医疗成本。因此,应消除或纠正具有统计学和医学意义的偏倚。

但是,值得注意的是,“一切都应该完美”的“纯粹主义”方法并不是解决常见检验医学问题的实用方法。实验室资源不应浪费在纠正不影响临床决策的微小差异上。根据阿尔伯特·爱因斯坦的说法,“凡事应尽可能简单,但不能过于简单(everything should be made as simple as possible, but not simpler)”。

在这篇综述中,从计量和统计、实验室和临床的角度对偏倚进行了评估,以便从临床角度进行实际应用。

一、偏倚的计量与统计学视角

(一)定义

术语偏倚(bias)、正确度(trueness)和系统误差(systematic error)是相互关联的。根据国际计量学词汇(VIM)第3版:

测量偏倚是“系统测量误差的估计(estimate of a systematic measurement error)”(2.18)。

测量正确度被定义为“无限多个重复测量值的平均值与参考值之间的接近程度(closeness of agreement between the average of an infinite number of replicate measured quantity values and a reference quantity value)”(2.14)和“与系统测量误差成反比,但与随机测量误差无关(“is inversely related to systematic measurement error, but is not related to random measurement error)”(注2)。

仪器偏倚定义为“重复的平均示值减去参考值(average of replicate indications minus a reference quantity value)”(4.20)。

基于这些定义,偏倚的估计需要两个主要组成部分:(1)参考值或赋值,以及(2)重复测量值(图1)。如果这两个分量中的一个未知或尚未正确确定,则无法正确估计偏倚。

img


从数学上讲,偏倚可以使用以下方程式计算:

img


偏倚不是一个精确的值。每个测量结果都有一个系统和随机的分量,重复测量的平均值有一定程度的变化,具体取决于所选的概率。

(二)偏倚的类型

不同浓度的测量精密度存在差异,在接近定量限和测量上限的区域,测量方法的线性会丧失。测量的偏倚可以是恒定的或成比例的。在恒定偏倚(constant bias)中,目标值和测量值之间的差值是恒定的,而在比例偏倚(proportional bias)中,靶值和测量值之间的差值与被测变量的量成正比(即,它是被测变量浓度的函数)(图2)。两种方法之间的偏倚可以使用Bland-Altman图进行评估。【医学检验中的数据分析:方法的一致性评价

Passing–Bablok回归分析也可用于评估两种方法之间是否存在恒定和比例偏倚(图2)。

img


两种方法的回归方程可以写如下:y=ax+b,其中a是斜率,b是截距。如果y=x(即a=1和b=0),则可以认为两种方法或仪器之间没有显著偏倚。请注意,在a≠1和b≠0的情况下,应使用斜率和截距的95%置信区间(CI)来评估a和b的显著性。如果a的95%置信区间包括1,则可以得出结论,两种方法之间没有显著的比例偏倚。同样,如果b的95%置信区间为0,则可以得出结论,两种方法之间没有显著的恒定偏倚(图2)。

(三)偏倚的测量

实际上,偏倚测量需要参考值和重复测量的平均值的可用性(图1A)。参考值可以使用有证参考物(certified reference materials,CRMs)或使用参考方法测量的新鲜患者样本来确定。如果参考值不可用,则可以使用赋值来估计偏倚(图1B)。偏倚不应仅通过从参考值或赋值中减去测量值的平均值来估算。此外,应评估和确认偏倚的重要性。从参考值或赋值中减去单个测量结果不会产生偏倚,这是医学实验室中常见的错误,特别是在计算测量程序的西格玛度量(sigma metric,SM)时。

偏倚的特征取决于测量程序和偏倚估计的数据收集持续时间;因此,测量条件对偏倚及其意义有显著影响

(四)偏倚的测量条件

在计量学上,可以定义三种偏倚的测量条件:

1.重复性条件(Repeatability conditions)

(1)测量程序、仪器、操作条件、操作员和位置(实验室)必须相同;

(2)重复测量必须在短时间内(不超过一天)一次性完成。

在重复性条件下进行重复测量会产生最小的随机变化,如果存在偏倚,很容易检测到。

2.中间精密度条件(Intermediate precision conditions)

中等精密度条件是指在单个实验室中使用不同的仪器、操作条件、操作员、试剂和校准器在几个月内分析的被测对象的变化。中等精密度条件下的重复测量显示出比重复性条件下更高的随机变化,如果存在偏倚,可能很难检测到(图3)。

img


3.再现性条件(Reproducibility conditions)

除了重复性和中间精密度外,再现性条件还包括不同实验室的总变化。在可再现性条件下重复测量的变化包括来自不同来源的所有类型的变化,例如几个月内的测量程序、仪器、操作条件、操作员和地点(实验室)。在重复测量中,与在中间精密度条件下进行的测量相比,在再现性条件下的测量显示出最高程度的随机变化,如果存在偏倚,可能很难检测到。

(五)偏倚的显著性

由于偏倚被定义为目标值与重复测量平均值之间的差值(图1),因此在进一步计算之前,应评估计算出的偏倚的显著性。偏倚的显著性可以通过t检验来评估。或者,虽然在某些情况下可能不具有统计准确性,但在非常实际的情况下,可以使用95%置信区间来评估偏倚的显著性。这种评估本质上更直观,而不是严格的统计评估。如果重复测量结果平均值的95%置信区间与目标值重叠,则偏倚不显著,而如果没有重叠,则认为偏倚显著。请注意,由于偏倚和不精密度是相关的,因此方法的不精密度会显著影响偏倚的重要性。

二、偏倚的临床实验室视角

临床实验室需要一个实用的程序来处理偏倚,包括仪器的分析性能、样本类型、测量程序、数据收集期和统计技术。

(一)分析性能指标

分析性能指标(Analytical performance specifications,APSs)是一组标准,规定了测量程序的分析性能所需的质量,以提供实验室测试结果,为患者实现最佳的健康结果,而不会造成伤害。

在日常实践中,测量系统的分析性能是通过计算系统和随机变化来评估的,即偏倚和不精密度。除了偏倚和不精密度外,在过去的四十年里,总允许误差(TEa)已被公认为APS的一个组成部分,并被用于各种目的。然而,TEa存在局限性,包括国际计量学词汇(VIM)中缺乏定义和计量学中缺乏契合。

注:实际工作中,我们也遇到了很多困惑!【指南学习:【行标】《定量检验程序分析性能验证指南(WS/T 408-2024)》


TEa的标准方程式如下:

img


在偏倚和CV的线性组合中,CV(正态分布)的一侧仅包含在计算中;因此,95%概率的适当乘数为1.65。CV代表测量程序的不精密度。

根据《测量不确定度表示指南》(GUM),在计算APS和其他指标时,应校正偏倚,不应包括已知偏倚。由于上述限制,TEa不应在实验室医学中用于表示容忍限(tolerance limit,TL)和/或测量不确定度(measurement uncertainty,MU)。在计量学中,总误差(不是TEa)对应于准确度(accuracy)准确度是偏倚和不精密度的结合,可用于评估单个测量结果的误差(error)。因此,外部质量评估方案(External Quality Assessment Scheme,EQAS)程序中使用了准确度。在临床实验室中,TEa被错误地使用或推荐,而不是TL、MU或其他可靠指标。TL或容忍区间(tolerance interval)包含采样过程或总体中指定比例的单位;尽管TEa解释了检验医学中的许多现象,但实际上它并不能解决任何问题,在计量学中也没有地位。因此,在本综述中,它不被视为APSs的一部分。

为防止误诊,应该确定被测量结果偏倚的可接受限(acceptable limits)。

(二)可接受偏倚模型的推导

可接受限或TL可以根据各种因素确定,包括客户要求、临床需求、既定指南和统计方法等。尽管付出了巨大的努力,但在生物样本中测量的实验室分析物的可接受限尚未明确界定。已经组织了两次国际会议以确定医学实验室APSs的标准:斯德哥尔摩和米兰共识(Stockholm and Milan consensuses)。

1999年在斯德哥尔摩举行了第一次全球分析质量规范会议。根据斯德哥尔摩共识,APSs基于五个层次标准,最高排名标准具有最高优先级。如果应用第一个标准不可行,则应使用第二个标准,依此类推,按优先级降序。

尽管斯德哥尔摩共识旨在根据医疗需求确定APS的验收标准,但它在15年内没有在检验医学中产生预期的效果。

2014年,欧洲临床化学与检验医学联合会(EFLM)在米兰组织了一次战略会议,以修订斯德哥尔摩共识,该共识被命名为米兰共识。APS标准根据临床和实验室要求进行了修订和简化,技术可实现性被认为是一个关键参数

在斯德哥尔摩共识和米兰共识中,层次结构中的第一个标准基于分析性能对临床结果的影响,第二个标准基于被测对象生物变异(BV)的组成部分。在米兰共识中排除了斯德哥尔摩共识的第三和第四个标准,APS标准被简化并限制在三个标准。最后一个标准(斯德哥尔摩共识中的第五个标准和米兰共识的第3个标准)基于最先进的测量技术,即技术上可实现的最高水平的分析性能。

自1999年以来,基于临床决策限(clinical decision limits)的实验室分析物的APSs一直难以定义。单个实验室测试可用于多种临床目的,导致各种相关的临床决策限。虽然第一个标准很好,但在实践中并没有得到广泛应用。没有一个模型可以应用于所有被测变量,因此,应用不同的模型是一种实用的方法来估计不同被测变量的APSs。或者,APS可以基于不同模型之间的折衷。为被测变量选择最合适的模型可能具有挑战性。

由于实验室测试的性质,斯德哥尔摩和米兰共识的第一个标准在实践中没有得到广泛应用,因此,实验室分析物的APSs主要基于第二个标准:生物变异(BV)

与临床结果不同,分析物中的BV可以很容易地估计出来。EFLM BV工作组对实验室检测BV做出了巨大贡献。在过去的十年中,该小组为BV研究制定了检查表和标准,使用严格的协议测量了多种分析物的BV,对文献中发表的多种分析物进行了BV数据的荟萃分析,并为大多数实验室检测推出了BV数据库https://biologicalvariation.eu/。该数据库是动态的,在发表关于BV的新论文时会进行更新。

问题仍然是如何开发一个模型来估计基于BV的偏倚的可接受限度。有一个基于BV的不精密度可接受限的模型。该模型基于分析变异对总变异的贡献,使用以下方程计算:

img


三重模型(triple model)的绩效评估如下:

理想性能定义为CVA<0.50 CVI。在这里,分析变异对总变异的最大贡献为12%

最佳性能定义为CVA<0.25 CVI。在这里,分析变异对总变异的最大贡献为3%。

最低性能定义为CVA<0.75 CVI。在这里,分析变异对总变异的最大贡献为25%。

不精密度的可接受极限可以根据分析变化对总变化的贡献进行建模;然而,这种方法不能用于偏倚。由于偏倚是一个线性参数,参考区间(RI)可用于模拟可接受偏倚的限度。

医生通常使用传统的参考区间进行临床决策。如果患者的实验室结果在RI范围内,则视为正常;否则,它们被认为是异常的。因此,偏倚对疾病误诊有各种影响。实验室测试结果中的正偏倚将增加超出上限(UL)的RI百分比,并降低超出下限(LL)的百分比。负偏倚会产生相反的效果。RI内的实验室测试结果被认为呈正态分布。正态分布的几何形状不是矩形;因此偏倚对UL和LL的影响是不对称的。使用正态分布数学,我们可以计算出存在偏倚时RI外个体的百分比。这可用于基于BV对偏倚的可接受限度进行建模,就像不精密度一样。

img


传统的基于人群的RI包括受试者间和受试者内的BV,因此可以根据它们的高斯组合计算可接受的偏倚。可接受偏倚的模型基于存在偏倚时RI之外的可接受人数。之前已经报道了从BV数据中得出可接受偏倚的模型的详细信息。如图4A所示,RI的LL和UL设置为覆盖95%的总体值。如果测量程序有正偏倚,曲线将向右移动(图4B);>2.5%的人口将具有高于UL的值,<2.5%的人口值将在LL之外。由于曲线的钟形,UL外的总体值的增加将高于LL外的总体价值的减少。图4B显示了由偏倚增加引起的RI内外总体值的变化。

从数学上讲,曲线下面积(AUC)可用于计算RI内外的总体值,如下所示:

img


根据方程式5,RI内的AUC可以使用方程式6计算:

img


根据方程式5和6,RI之外的总体值可以根据方程式7计算:

img


方程式5-7非常复杂,不能在日常实践中使用。相反,z变换和z表可用于计算RI内外的AUC和总体值。【文献学习:“zlog值”实验室结果标准化的依据


图5中给出了一种实用的方法。当存在偏倚时,该图可用于轻松估计RI内外的总体值。

img


基于正态分布,提出了偏倚的三重模型(见补充表S3):

img


img

理想性能定义为BA<0.250CVB。在这里,由于偏倚,0.8%的新增人口将在传统RI之外,5.8%将在RI之外。

最佳性能定义为BA<0.125CVB。在这里,由于偏倚,0.1%的额外人口将在传统RI之外,5.1%将在RI之外。

最低性能定义为BA<0.375CVB。在这里,1.7%的新增人口将处于传统RI之外,6.7%的人口将由于偏倚而处于RI之外。

(三)短期和长期偏倚(Short- and long-term biases)

在常规实践中,临床实验室使用不同批号的耗材、质控样品、校准品和试剂。通常使用质控物监测测量结果的准确性(accuracy),如果质控物的测量结果不在可接受的范围内,则对仪器/测量系统进行校准。校准可以纠正与目标值的偏倚;因此,任何经常校准的测量系统都可能在平均值附近显示偏倚模式(图3)。因此,偏倚特性随时间变化,根据在重复性条件下获得的重复测量结果估计的偏倚模式预计与根据在中间精密度或再现性条件下收集的数据估计的不同。

需要从EQAS中的同行组(peer group)数据获得可靠的目标或公认值(consensus value)来估计偏倚。

(四)偏倚与外部质量评估方案

虽然建议从计量学的角度使用有证参考物(CRM)和参考方法来估计偏倚,但这在临床实验室中实际上是无法实现的。现代临床实验室分析不同样本类型中的数千个测量值;因此,评估测量程序的质量和性能的程序应该是实用且具有成本效益的,而不是纯粹的理论。许多实验室使用EQAS的指定值来估计偏倚。然而,这并不代表使用CRM和参考方法确定的实际偏倚。根据EQAS数据计算的偏倚是性能偏倚(performance bias)由于实验室的性能是使用其他实验室的数据进行评估的,因此实验室的偏倚反映了实验室在同行中的地位。同行组(peer group)的赋值或平均值并不反映使用CRM和参考方法测量的分析物的实际值。EQAS程序的目的不是估计偏倚,EQAS样本通常是不可互换的因此,使用EQAS数据估计的偏倚可能并不代表患者实验室检测结果中的实际偏倚。

(五)偏倚与互换性(Commutability)

根据VIM,参考材料的互换性被定义为“参考材料的性质,通过根据两个给定的测量程序获得的该材料中规定量的测量结果之间的关系与其他指定材料的测量结果间的关系之间的接近程度来证明”(“property of a reference material, demonstrated by the closeness of agreement between the relation among the measurement results for a stated quantity in this material, obtained according to two given measurement procedures, and the relationship obtained among the measurement results for other specified materials”)。换句话说,对于互换性,从测量程序中获得的测试材料的分析反应(analytical response)应与患者样本的分析反应相同。因此,可互换材料可以代表新的患者样本进行方法比较。

在临床实验室中,对人体样本(全血、血清、血浆、尿液和其他体液)进行分析。因此,用于评估质量指标的样本必须代表人体样本。然而,在实践中,商业质控品(QC)用于评估质量指标。由于商业QC样品使用时间较长,因此必须稳定。为了提高质量控制材料的稳定性,去除脂质并冻干样品,从而得到与新鲜患者样品不同的基质。尽管新鲜的患者样本可以互换,但它们不稳定,不能长期使用。由于缺乏互换性,商业质控品并不代表患者样本,因此,从商业质控品和新鲜患者样本估计的偏倚和不精密度可能不同。理想情况下,参考材料和/或商业质控品应与患者样本互换。样本的互换性可以根据CLSI指南进行估算。需要估计参考方法和常规方法之间观察到的偏倚,以评估样本的互换性。因此,可以使用正确设计的偏倚实验来估计互换性,也可以使用可互换材料来正确估计偏倚。

(六)偏倚与测量不确定度(MU)

由于MU是所有类型测量中不可分割的一部分,准确计算MU长期以来一直是计量学的研究重点

已经提出了各种MU计算方法;然而,全球尚未达成共识,特别是在日常实践中使用。许多参数,包括仪器、试剂、方法、实验室环境和技术人员,都会影响分析物的MU。参数的数量及其对MU的贡献因分析物和实验室而异。为了解决这个问题,已经提出了两种计算分析物MU的主要方法:自下而上(A型)自上而下(B型)方法。【读书笔记——TIETZ(第七版)“医学检验中的统计学方法”(12): 测量不确定度

在自下而上的方法中,所有可能的MU来源都包含在总MU的计算中。这种方法通常适用于新开发的方法、内部方法和具有多个组成部分的测量程序。然而,这种方法很耗时,在计算MU之前需要详细的路线图分析。可能无法确定MU的所有可能来源,特别是在自动测量系统中。

在自上而下的方法中,实验室收集的质量控制数据,如内部质量控制或EQAS数据,用于计算总MU。这种方法对于计算医学实验室中分析物的MU更实用,特别是对于自动分析仪。

MU几乎应用于所有工业部门,但在医学实验室中效果不佳。与其他计算不同,MU计算在医学实验室中尚未标准化。尽管ISO 15189指南建议在医学实验室中对每种分析物进行MU计算,但没有解释如何进行这些计算。一些指南建议使用自下而上的方法来计算MU,而ISO关于计算医学实验室分析物MU的指南直到2019年才发布ISO/TS 20914:2019,建议纳入三个主要参数来计算MU:精密度(precision)、偏倚和校准不确定度。根据MU组件的可用性,建议采用不同的方法,如下所示。

如果所有成分(即不精密度、偏倚和校准不确定性)都可用,则可以使用以下方程来估算分析物的MU。

img


如果偏倚或校准不确定度不可用,这些分量可以从MU方程中排除,如下所示:

img


尽管指南建议纳入长期不精密度(long-term imprecision),但在中间精密度条件或再现性条件下收集的长期数据也包括偏倚。如上所述,在讨论短期和长期偏倚时,对于经常校准的仪器,长期偏倚变成了随机变化。在再现性条件下收集的数据图(图3)显示,偏倚不能作为一个单独的参数进行评估,根据再现性条件下收集的数据集计算的不精密度涵盖了所有已知的变化,包括偏倚。图3所示的数据包含从经常校准的仪器收集的所有测量结果。根据EQAS评估,与同行相比,仪器性能可以接受。没有理由通过包括其他参数来扩大这些数据的变化。

然而,这些指导方针并没有为这些参数提供严格的框架。在ISO/TS 20914:2019中,根据室内质控数据计算不精密度,根据EQAS数据计算偏倚,并从制造商处获得校准不确定度。

关于如何获得这些参数的细节尚不清楚,因为测量程序的不精密度可以从在可重复性、中间精密度或再现性条件下收集的数据中计算出来。在可重复性条件下收集的数据的不精密度预计最低,在再现性条件下采集的数据的不精密度最高。偏倚也可以使用CRM和参考方法或EQAS数据计算;然而,在进一步计算之前,应该评估偏倚的显著性

实验室数据并不准确,根据包括方法和样本在内的几个因素,存在不同程度的变化,导致数值数据的差异,这可能是显著的或不显著的。由于偏倚是参考数据与重复测量平均值之间的差异,因此在进一步计算中使用偏倚之前,必须解决偏倚的显著性。在MU计算中使用偏倚而不评估其显著性可能会人为地增加总MU。

MU应包括影响患者测试结果的最有影响的因素,而不是许多无关紧要的因素。根据在可重复性条件下收集的数据估算MU是医学实验室的一种实用方法。由于偏倚是在再现性条件下收集的数据的一个组成部分,因此不应将其作为单独的参数包含在MU计算中。

另一个问题是MU计算中的偏倚处理。如方程式9所示,偏倚通常作为类似于不精密度的二次参数包含在MU计算中。用数学术语来说,将方差与线性参数相加是无效的;因此,只有变量的方差可以加在一起。

总之,

(1)在MU计算中加入偏倚,特别是如果不精密度是根据在可重复性条件下收集的数据计算的,人为地增加了总MU;

(2) 将偏倚视为方差在数学上是不正确的;

(3)在进一步计算之前,应考虑偏倚的重要性。

(七)偏倚与六西格玛(Six Sigma)

六西格玛是新千年广泛接受的全面质量管理标准方法。可以使用西格玛量表客观地评估过程的性能。如果一个过程具有六西格玛的水平,那么每一百万个机会中只会产生3.4个缺陷(DPMO),这可以被认为是黄金标准。过程的西格玛度量(sigma metric,SM)可以使用方程式12计算:

img


其中TL是过程的容许限(从上限到下限),SD是过程的标准偏倚。

20世纪80年代,Bill Smith和摩托罗拉股份有限公司的工程师开发了六西格玛方法。因为SM被认为是过程平均值和UL/LL之间的SD数量,所以过程的平均值可以居中,这与过程的目标相同。在实践中,情况是不同的,可以观察到过程的平均值和目标之间的变化。根据长期观察,这种偏移约为1.5 SD(图6)。

img


在等式12中,偏倚不直接包括在SM计算中。然而,六西格玛方法论并没有忽视偏倚,而是正确地对待它。如果检测到偏倚,应将其消除;即使可以消除偏倚,也不实用。然而,如果系统不提供实时监测(就像大多数医学实验室的情况一样),我们就不能确定不存在偏倚。在日常实践中,偏倚是月球的背面。为了克服这个问题,在与SM相关的所有计算中都包含了1.5 SD的偏倚,并相应地准备了DPMO到SM的转换表,反之亦然。因此,六西格玛对应于3.4 DPMO。然而,如果我们忽略偏倚,它对应于0.002 DPMO。

在医学实验室中,使用Westgard提出的修正方程计算过程性能

img


方程式13与方程式12的不同之处在于它包括偏倚,这种方法有两个主要缺点:

(1)首先,在方程中加入偏倚在数学上是不正确的,从方程13中获得的SM大大低估了过程性能。

(2)其次,DPMO表中包含1.5 SD偏倚,使用方程13计算的SM可能会大大低估过程性能。

由于偏倚在计算中被包括两次(一次在方程13中,一次在1.5 SD偏倚中),因此许多医疗器械和实验室测试的性能被计算为3-4 SM。这意味着医学实验室仪器的质量低于工业仪器?但事实并非如此。医学实验室仪器计算的低质量水平是由于方程式不正确,不切实际

在统计学中,各种分布,如正态分布、t分布和卡方分布,在不同的情况下使用。SM的数学基于正态分布,正态分布在几何上呈钟形,在数学上渐近于X轴(图6)。正态分布曲线向右或向左移动将改变TL内的AUC;然而,这种变化将不会与偏移成线性比例。偏倚和AUC之间的关系可以使用正态分布方程(方程5)计算。然而,方程5非常复杂,不能在日常实践中使用。相反,使用标准表来显示性能如何随偏倚而变化是可行的。

第二个要点是,计算中包含的偏倚很少反映实际偏倚。在医学实验室中,偏倚是根据EQAS数据计算的,其显著性需要确认。

(八)偏倚的校正(Correction)

在启动校正程序之前,必须评估偏倚的显著性并确认其存在。校正统计上不显著或临床上不重要的偏倚将浪费时间和金钱。对于重大偏倚,应进行根本原因分析,如果原因未知,则不建议进行校正。在这种情况下,应接受偏倚,并在所有报告的信息中考虑分析物的偏倚。如果偏倚显著且具有临床重要性,可以通过修改方法来消除。如果无法消除,则应启动校正程序。

三、偏倚的诊断视角

诊断准确性与被测对象的临床表现特征直接相关。灵敏度、特异性、阳性和阴性预测值、似然比和ROC曲线用于描述测试结果与诊断准确性之间的关系。【读书笔记——TIETZ(第七版)“医学检验中的统计学方法”(13): 实验室检查的诊断准确性

灵敏度和特异性是方法性能的关键组成部分,对这两个指标的正确估计都受到偏倚的影响(图7)。

img


显著的偏倚将降低实验室测试的诊断准确性(图8)。

img


图8。实验室测试的偏倚和诊断准确性。阳性或阴性偏倚极大地影响了实验室检测的诊断准确性。(A) 可接受的偏倚对实验室测试的诊断准确性没有显著的负面影响。(B) 偏倚的增加会导致疾病的误诊(蓝色区域),并会极大地削弱实验室检测的诊断能力。

偏倚是测量结果与真实值的系统偏倚,它对检验医学产生的信息有重大影响。然而,偏倚很少得到正确处理。虽然不精密度是基于重复测量来估计的,但偏倚是基于重复的测量和参考/目标值来估计的。此外,应评估和确认偏倚的重要性。在临床实验室中,偏倚是月球的黑暗面,其估计应基于适当的实验设计、数据收集、统计评估和可互换的样本。适当校正偏倚可以减少实验室错误,提高患者安全,并显著降低医疗成本。应消除或纠正具有统计学意义和医学意义的偏倚。医学实验室应制定政策,消除偏倚对向患者报告的数据的影响。未来的研究需要照亮月球的背面,即消除偏倚对医疗决策和医疗成本的负面影响。



参考文献:https://doi.org/10.3343/alm.2024.44.1.6

最后编辑于 02-03 · 浏览 2745

5 6 8

全部讨论0

默认最新
avatar
5
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部