CGP论著 | 不同衰弱评估工具在老年术前衰弱筛查中的应用效果比较研究
衰弱是指生理储备功能下降引起机体易损性增加及抗应激能力减退的非特异性状态[1]。据研究显示,老年患者术前衰弱患病率为16.8%~50.5%[2-7]。多项研究发现,术前衰弱是影响术后并发症、住院时间及病死率的独立危险因素,可增加术后并发症发生风险、延长住院时间等[8-10]。目前,国际上衰弱评估工具种类繁多,针对老年围术期的衰弱评估工具的应用选择不一,主要有11项改良衰弱指数(mFI-11)、FRAIL量表、临床衰弱量表(CFS)、5项改良衰弱指数(mFI-5)等,其中mFI-11是老年术前衰弱常用的评估方法之一。mFI-11是基于美国外科质量改进计划(NSQIP)数据库中的术前变量、针对手术人群改良编制而成,并进行了相关验证[11],在国内外围术期老年手术人群衰弱评估中应用相对广泛。国外多项系统评价显示,mFI-11可有效评估骨科、泌尿外科、头颈肿瘤、普外科等患者术前衰弱及预测术后不良结局[12-14]。但mFI-11以术前共病变量为主,且自2012年后,其11个复合变量中有5个变量数据已完全缺失,在评估方面可能会受到一定的限制[15];尽管如此,国外外科医生和研究人员仍广泛使用mFI-11来评估手术人群的衰弱且具有相对较好的预测效能[16-21]。此外,不同评估工具下老年术前衰弱发生率存在一定差异,如ARTEAGA等[22]运用FRAIL量表、CFS、分诊风险筛查工具(Triage Risk Screening Tool,TRST)和欧洲健康、老龄化和退休调查-衰弱工具(Survey of Health,Ageing and Retirement in Europe-Frailty Instrument,Share-FI)对老年普外急诊患者进行术前筛查,其衰弱发生率分别为14.1%、25%、29.2%和30.4%;MCISAAC等[23]运用CFS及衰弱表型(FP)对老年非心脏手术患者进行术前衰弱评估,其衰弱发生率分别为42.4%及36.7%。总体而言,目前国际针对围术期老年患者衰弱评估工具的选择尚未达成共识,尚未形成公认的衰弱诊断“金标准”,哪种衰弱评估工具更适合我国围术期人群尚不清楚。
基于此,本课题组前期根据国际衰弱指数条目创建原则[24],并基于国内医院信息系统(HIS)、结合文献研究及专家意见,选取32个条目变量作为健康总变量来改良构建围术期衰弱指数。为进一步对比围术期衰弱指数与常用衰弱评估工具效能,选择适合我国人群的围术期衰弱评估工具,本研究选择mFI-11为参考,比较FRAIL量表、CFS、mFI-5、围术期衰弱指数在老年手术患者中术前衰弱评估的应用效果,旨在为早期识别术前衰弱高风险的老年患者提供依据。
1 对象与方法
1.1 研究对象
采用方便抽样法选取2023年2—5月于广东省中医院行择期手术的住院老年患者329例作为研究对象。纳入标准:(1)年龄≥60岁,性别不限;(2)拟接受择期手术治疗;(3)美国麻醉医师协会(ASA)分级为1~3级;(4)能够独立或通过研究者协助完成问卷调查;(5)患者知情同意,自愿参加本研究。排除标准:(1)合并精神或严重视听及认知功能障碍无法沟通者;(2)疾病过于严重或其他原因无法行手术治疗;(3)因存在严重语言、听力障碍等各种原因无法配合完成问卷调查。本研究已获得广东省中医院伦理委员会批准(BE2022-165)。
1.2 样本量估算
本研究采用总体率估计的样本含量计算公式:N=[(Zα/2)2p(1-p)]/δ2计算,容许误差δ设为5%,α=0.05,Zα/2=1.96,p为围术期老年患者术前衰弱的发生率24.1%[3],计算得出样本量281例,考虑10%的无效病例,最终需要样本量为309例。
1.3 资料收集
采用统一调查问卷进行资料收集。收集患者一般人口学资料,如年龄、性别、婚姻状况、文化程度、吸烟史、饮酒史、多重用药(≥5种)等。
1.4 衰弱评估
1.4.1 mFI-11:mFI-11主要包括术前非独立功能状态、糖尿病史、慢性阻塞性肺疾病(COPD)病史、充血性心力衰竭病史、心肌梗死病史等11个条目,每个条目指标依据其“是”“否”正常计为0分或1分,总分0~11分。mFI-11评分=存在的缺陷数/匹配的缺陷数,≥0.27分为衰弱[11]。
1.4.2 FRAIL量表:FRAIL量表由国际营养、健康和老年工作组专家于2008年提出,主要包括疲乏、耐力、行走能力、多病共存及体质量下降5个条目,1个条目1分,评分≥3分为衰弱[25]。
1.4.3 mFI-5:mFI-5由SUBRAMANIAM等[26]将11项改良衰弱指数改良而成,包括非独立性功能状态、糖尿病、充血性心力衰竭、COPD及需要药物治疗的高血压5个变量,衰弱评分=存在的缺陷数/匹配的缺陷数,≥0.27分为衰弱。
1.4.4 CFS:CFS涵盖行动能力、能量、身体活动和功能等领域,共分为1~9级。1级为非常健康,2级为健康,3级为维持健康,4级为脆弱易损伤,5~8级分别为轻度、中度、严重、非常严重衰弱,9级为终末期[27];CFS分级≥5级即为衰弱。
1.4.5 围术期衰弱指数:本研究根据国际衰弱指数条目创建原则[24],并基于国内HIS、结合文献研究及专家意见,选取32个条目作为健康总变量来构建围术期衰弱指数。对选定的每个条目进行赋值,赋值范围为0~1分。衰弱指数的计算公式为:衰弱指数=健康缺陷累计得分/健康变量总分(32分)。并根据SEARLE等[24]对衰弱指数的定义,将衰弱指数≥0.25,即围术期衰弱指数≥8分定义为衰弱。
1.5 质量控制
研究者先向研究对象介绍本研究的目的及意义,获取研究对象知情同意后,关于问卷中自我报告式内容,由研究者采用统一指导语就条目逐一向患者提问,避免诱导性提示,根据患者回答填写相关条目,填写完毕后现场检查资料完整性;问卷中非自我报告式内容或客观指标(如共病情况、检验结果、BMI等)则通过检索电子病历系统及根据临床情况进行资料收集,最后采用双人双录入方法对数据进行整理分析。
1.6 统计学方法
采用SPSS 26.0、MedCalc 22.0软件及R语言软件包对数据进行统计分析。不符合正态分布的计量资料以M(P25,P75)表示,计数资料以例数或百分比表示。应用Kappa检验评估5种衰弱评估工具之间的一致性。以mFI-11评估结果为参考,通过决策曲线(DCA)和受试者工作特征(ROC)曲线分析其余4种工具对老年术前衰弱发生率的诊断价值,计算ROC曲线下面积(AUC),并采用DeLong检验比较各评估工具间AUC的差异。根据约登指数(YI)最大原则确定各衰弱评估工具的最佳临界值,计算在原始和最佳临界值时的评估性能指标,包括灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)。以P<0.05表示差异具有统计学意义。
2 结果
2.1 一般资料及衰弱评估
329例老年手术患者中男133例(40.4%),女196例(59.6%);中位年龄为69(65,73)岁;其中符合mFI-11、FRAIL量表、CFS、围术期衰弱指数及mFI-5评估标准的老年术前衰弱患者分别为34例(10.3%)、46例(14.0%)、69例(21.0%)、51例(15.5%)及77例(23.4%),见表1。

2.2 5种评估工具对老年术前衰弱筛查的一致性
一致性分析结果显示,CFS与围术期衰弱指数对老年术前衰弱评估的一致性最高(Kappa=0.655,P<0.001),其次是mFI-11与mFI-5、mFI-11与围术期衰弱指数(Kappa=0.485、0.449),FRAIL量表与mFI-5及mFI-11对老年术前衰弱的评估一致性最低(Kappa=0.182、0.262),见表2。

2.3 4种衰弱评估工具的性能比较
本研究以mFI-11评估衰弱结果为参照,4种评估工具得分结果为检验变量分别绘制ROC曲线(图1)和DCA曲线(图2)。ROC曲线分析结果显示,FRAIL量表、CFS、围术期衰弱指数及mFI-5的AUC分别为0.799、0.823、0.888及0.920,CFS及mFI-5的最佳临界值与原始临界值一致,见表3。



4种评估工具的ROC曲线AUC比较结果显示,mFI-5的AUC大于FRAIL量表、CFS,差异有统计学意义(P<0.05);围术期衰弱指数的AUC大于FRAIL量表,差异有统计学意义(P<0.05),见表4。

DCA分析结果显示,当阈值概率≥5%且≤40%时,4种评估工具对老年术前衰弱发生均具有诊断意义,其中mFI-5具有最高的净效益、围术期衰弱指数次之(图2),而当阈值概率>40%,FRAIL量表及CFS出现负影响或净效益逐渐为零。
3 讨论
衰弱是老年人常见的一种临床综合征[28],在社会人口老龄化背景下,老年手术患者日益增多,50%以上的老年患者在手术治疗期间处于衰弱状态[29],既往研究报道老年患者术前衰弱患病率为16.8%~50.5%[2-7],存在一定的差异。本研究发现符合mFI-11、FRAIL量表、CFS、围术期衰弱指数及mFI-5评估标准的老年术前衰弱患病率分别10.3%、14.0%、21.0%、15.5%及23.4%。通过Kappa一致性检验发现,在本研究衰弱评估中,mFI-11与围术期衰弱指数、mFI-11与mFI-5之间的一致性中等,mFI-11与FRAIL量表、mFI-11与CFS之间的一致性较差,这可能与不同衰弱评估工具的筛查标准尚未统一有关。
3.1 4种衰弱评估工具对老年术前患者衰弱筛查性能的比较
本研究结果显示,mFI-5、围术期衰弱指数、CFS及FRAIL量表的AUC分别为0.920、0.888、0.823及0.799(AUC均>0.7),4种衰弱评估工具对mFI-11诊断的术前衰弱均具有较好的诊断准确性,其中mFI-5对术前衰弱筛查的准确性最高,具有相近的评估作用,与既往结果相一致[30]。ROC曲线分析结果显示,mFI-5的最佳临界值与原始临界值一致,特异度相对稳定,在原始临界值下,灵敏度均高于其余3种衰弱评估工具,但具有NPV较高、PPV较低的特点,与既往研究[31-32]结果一致。同时,DCA分析结果显示,当阈值概率≥5%且≤90%时,mFI-5在筛查术前衰弱方面比其余3种衰弱评估工具更有效。可能原因是mFI-5由mFI-11简化改良而成,保留了相关的评估变量,因此在筛查mFI-11诊断的术前衰弱方面具有较高相似的诊断性能,与既往结果相一致[33]。
原始临界值时围术期衰弱指数的特异度与NPV、灵敏度与PPV相对一致,提示筛查结果与诊断结果的一致性相对较好。在最佳临界值时其灵敏度及特异度分别为94.12%、71.86%,但PPV相对较低,即筛查结果与诊断结果一致性较一般,可能与该衰弱指数是基于国内HIS系统改良构建而成,由于中西方生活文化习惯及医疗系统存在的差异性,条目表达方式可能存在一定差异。同时,DCA分析结果显示,相对于CFS及FRAIL量表而言,当预测术前衰弱发生风险≥5%时,围术期衰弱指数的临床净获益更高且相关风险阈值范围更广。
本研究结果显示,CFS原始临界值和最佳临界值一致,在最佳临界值时其灵敏度低于mFI-5及围术期衰弱指数,呈现PPV低、NPV较高的特点。同时本研究CFS的AUC均小于mFI-5及围术期衰弱指数(P<0.05);与FRAIL量表AUC比较,差异无统计学意义(P>0.05),提示CFS在筛查术前衰弱方面的准确性与FRAIL量表相似;DCA结果显示,CFS与FRAIL在相关风险阈值存在重叠,仅当阈值概率≥15%且≤40%时,CFS在筛查术前衰弱方面比FRAIL量表的效用高,与既往研究不一致[34],这可能与本研究纳入了多种手术类型而既往研究[34]纳入手术类型比较单一有关,不同手术类型的老年手术人群其术前基础疾病情况、活动耐力等情况可能具有一定差异性,从而导致相同衰弱评估工具在评估不同手术类型人群时术前衰弱预测性能不同。
另外,在原始临界值时FRAIL量表特异度较高、灵敏度较低,提示其识别术前衰弱患者的能力较弱,即漏诊率较高。FRAIL量表的最佳临界值为>1分,此时其灵敏度升高,特异度相对降低,对术前衰弱的筛查性能相对提高。由DCA分析结果可知,在相关风险阈值范围内,FRAIL量表对术前衰弱筛查的临床净获益均比其余三种衰弱评估工具较低;而AUC比较结果显示,CFS与FRAIL量表对衰弱筛查的准确性比较,差异无统计学意义(P>0.05),与XING等[34]研究不一致而与THIAM等[35]研究一致,这可能也与各研究纳入的不同手术类型有关。
3.2 mFI-5、围术期衰弱指数具有良好的评估性能
本研究通过对各衰弱评估工具的AUC进行比较及DCA分析发现mFI-5的筛查准确性高于FRAIL量表、CFS(P<0.05),且该工具的灵敏度与特异度也均较高;同时本研究也发现,围术期衰弱指数筛查准确性高于FRAIL量表(P<0.05),但与mFI-5的AUC比较,差异无统计学意义(Z=1.059,P=0.289),提示两者在mFI-11诊断的术前衰弱筛查中的应用效果相对较好。衰弱是一种多维度状态,受生理、心理及社会等多方面的影响[36]。相对于临床而言,mFI-5评估条目少且简便快捷,但mFI-5条目内容以疾病变量为主,在认知、心理社会等维度的筛查存在一定的局限性。而围术期衰弱指数包含了共病、日常活动能力及躯体功能、营养和实验室检查等方面内容,综合预测性能相对较好;同时围术期衰弱指数基于国内HIS系统、针对国内手术人群所改良构建而成,其所有条目变量可在HIS系统中检索,可根据系统设置自动生成,极大程度节省了临床医务人员的评估时间。
本研究的局限性:(1)本研究为单中心研究,研究对象仅来自一所医院,欠缺代表性及推广性;(2)本研究未对纳入的老年手术人群进行分类筛查,进一步分析各个衰弱评估工具对不同手术人群术前衰弱的评估性能;(3)本研究为横断面研究,无法观察到各衰弱评估工具的评估结果对老人术后结局的影响。因此,未来需进一步开展相关纵向研究探讨衰弱评估工具对老年术前患者衰弱发生及相关不良结局的预测能力,以综合评价衰弱评估工具在老年术前患者中的应用效果。
综上所述,本研究所涉及的4种衰弱评估工具中,mFI-5评估条目少、筛查准确性较高,且在最佳临界值时具有较高的灵敏度和特异度;围术期衰弱指数的筛查准确性次之,但其综合预测性能相对较好且临床推广及运用较便利;然后依次为CFS、FRAIL量表。因此,在临床实践中,医护人员应结合具体情况选择合适的衰弱评估工具进行术前衰弱评估,从术后衰弱转向术前衰弱,手术风险管理前移,以应对患者现存的衰弱风险因素、指导制订个体化手术方案;同时,在临床条件允许下,选择多维度、多领域的衰弱评估工具进行术前衰弱评估,可帮助医护人员了解患者术前生理、心理及社会等方面状况,针对患者现存问题采取多学科协作模式,为患者提供相应的围手术期干预措施,进行有效的术前衰弱管理,优化临床结局,促进患者快速康复。
参考文献略
最后编辑于 2024-07-15 · 浏览 2565