dxy logo
首页丁香园病例库全部版块
搜索
登录

临床研究中的患者报告结局量表-JAMA统计与方法指南

发布于 2023-04-15 · 浏览 1139 · IP 江苏江苏
这个帖子发布于 2 年零 27 天前,其中的信息可能已发生改变或有所发展。

本译文仅用于学术交流

临床研究中的患者报告结局量表

Patient-Reported Outcome Measures in Clinical Research

原著:Kevin P.Weinfurt, PhD; Bryce B. Reeve, PhD

翻译:墨点星沟,医学硕士,公共卫生医师/生物统计师

健康状况可能会导致患者感到不适,并损害其日常生活功能。因此,在评估预防或治疗健康状况的干预措施效果时,对患者的感受和功能进行评估是很重要的。一些可由患者直接报告的,能反应某方面健康状况的指标,例如疼痛的严重程度或身体功能的受限情况等,被称为患者报告的结局。

推荐的定量测量这些健康状况的方法是使用标准化问卷/量表直接询问患者。患者报告结局量表是“直接来自患者的健康状况的报告,不需要临床医生或任何人进行解释的患者反应”1。举个患者报告结局量表的例子,Ghogawala等人2在一项随机临床试验中使用了SF-36作为患者报告结局,用以比较两种手术入路(腹侧或背侧)治疗脊髓型颈椎病(一种会导致身体功能严重受损的疾病)的疗效。

名词解释

什么是患者报告结局量表?

患者报告的结局测量是一份旨在评估患者报告的结局的问卷,被评估的结局被称为概念、观念或领域,其中的单个问题被称为项目/条目。有一些患者报告结局量表在设计时只为测量一个概念(例如,用于测量疲劳的4条目量表),也有一些被设计为测量多个概念 (如SF-36,共36项,测量8个健康概念)。患者在该概念上的得分是通过他们对1个或多个问题(或条目)的回答来估计的,而问题答案备选项为标准化答案选项。

例如,患者报告结果测量信息系统SexFS3中的一项旨在测量性行为兴趣的条目:在过去的30天里,你对性行为的兴趣有多大?问题答案的备选项分别是“完全没有”、“有一点”、“偶尔有”、“相当大”、“非常大”。这些答案备选项可以被看作有序变量,同时可以将这些字符选项赋值为递增的数字,比如完全没有/完全不=0,有一点=1。一些回答选项将数字整合在了量表中,例如11分疼痛强度数值评定量表,0 =无痛,10 =最痛。根据每个条目的回答结果,患者报告结局量表产生一个分数,代表患者对健康概念的感知水平。

设计一个新的患者报告结局量表和收集有效性证据是一个严格的多步骤的过程,包括定性和定量方法4。首先,通过个人访谈或焦点小组的定性研究来了解患者对某一健康问题的体验,以便患者报告结局量表的开发者知道要评估什么。接下来,按照问卷设计的最佳做法编写项目,以评估健康概念。这些条目通常给出一个回忆期 (例如,“过去7天,…”或“过去24小时,…”),需要开发人员根据被测量的症状或功能的可变性和期望的回忆准确性进行选择。然后对患者进行个体认知访谈,以评估项目和内容的可理解性和适用性。

接下来,使用新的患者报告结局量表对患者样本进行测量和定量研究,以查看项目是否如开发人员预期的那样表现良好(例如,所有与身体功能相关的项目回答都是相互关联的)。开发人员收集得分可靠性的证据(例如,测试-重测可靠性;观察评分如何在临床稳定人群中随着时间的推移保持稳定)和有效性证据,包括新的患者报告结局量表得分与其他相关变量(如临床标记物、其他已建立的患者报告结局量表或其他结局)之间的关系。收集到的有效性证据类型可能取决于患者报告结局量表的类型(例如,单个项目测量1个概念,多个项目测量1个概念,或多个项目测量多个概念)和患者报告结局量表拟使用的场景(例如,在试验中筛选合格患者,作为主要终点或探索性终点的要素)。

为什么患者报告结局量表很重要?

患者报告结局量表通常能获取患者关于疾病和治疗感受的信息,一般情况下这些是不能被他人通过任何方式所感知到的。例如,患者可以直接报告他们的疼痛、疲劳或焦虑,而外部观察者只能通过观察患者的痛苦表情、表现出来的疲倦或紧张等行为来间接地获知这些感受/体验。患者通常是他们日常健康经历/感受的最佳记录和报告者,因为他们生活在那些经历/感受中,而临床医生和其他人不太可能在他们的生活环境中完全接触到患者。患者报告结局量表的另一个优点是,它们通常比临床测量更快、负担更轻、收集成本更低。

患者报告结局量表的局限性和替代方案

对于不能可靠地报告自身健康感受的患者,例如年龄太小、疾病过于严重或者有意识障碍,患者报告结局量表是不适用的。在这种情况下,可以考虑采用基于护理人员或临床医生报告的测量结果,但不应被视为等同于患者自我报告。当调查项目要求患者回忆他们在过去较长的一段时间内(例如,“在过去四周内,……”)的经历时,记忆错误(回忆偏倚)可能会影响到量表分数。当遇到这类问题时,患者报告结局量表的开发者可以使用更短的回忆期或进行实证研究来评估回忆的准确性。

对于临床医生来说,患者报告结局量表可能不像其他类型的结果那么熟悉。为了使用这些评分来解释研究结果,可能需要更多的实证研究来理解患者报告结局量表的评分差异如何与患者的健康体验或传统结局指标的差异相对应。例如,Ghogawala等人引用了一项早期研究5,提出SF-36变化5分或更多对患者来说是有意义的,代表了最小的临床重要差异6

对于患者报告结局量表和医生-护士报告量表这类主观评价,可能会受到被调查对象期望的影响,这种影响可能会导致开放性研究的疗效估计发生偏倚。通常情况下,患者感觉或功能的评估是没有金标准的,这意味着患者报告结局量表的选择不能基于与标准规范最相关的测量 (临床医生和观察者报告量表也是如此)。

将患者报告结局量表纳入到临床研究需要认真考虑许多问题,包括量表使用的媒介(如平板电脑)、数据缺失的预防、跨国研究中患者报告结局量表的文化或语言相关性,以及明确定义的终点的构建。患者报告结局量表的评分可以是有序的或等距的,需要使用适当的统计分析来评估组间的差异或随时间的变化。对于涉及患者报告结局量表的高质量临床试验方案7,以及在临床试验中报告基于患者报告结局量表的终点8,都有国际指南可参考。关于使用患者报告结局的伦理考虑的指南也已经发表9

患者报告结局量表在案例中是如何应用的?

在Ghogawala等人3的试验中,研究者想了解不同的手术入路是如何改变患者日常生活中的身体机能和身体疼痛的。他们使用SF-36对患者进行了术前和术后的评估,该量表包括8个子量表/维度得分,反映了健康的不同方面:活力、身体功能、身体疼痛、一般健康认知、身体角色功能、情感角色功能、社会角色功能和心理健康。因为研究者希望评估手术对身体健康的广泛影响,所以他们使用了SF-36身体部分总评(PCS)评分,PCS评分是每个患者8个子量表评分的加权组合,身体健康相关维度的权重较大。

领域的加权组合,如PCS评分,可以避免由多个主要终点引起的问题(例如,当多个主要终点的治疗效果不一致时,出现I型错误的可能性增加10,并且难以解释研究结果)。PCS分数是标准化的,50分对应于美国普通成年人的平均分,标准差(SD)为10。这种标准化可以使分数的解释更加容易。例如,PCS得分为45的人,可以说他的整体身体健康水平比美国成年人的平均水平低0.5个标准差。

如何解读患者报告结局量表?

这一外科手术试验未发现两种手术入路在PCS评分上的差异有统计学意义(估计均差,0.3 [95% CI:- 2.6 ~ 3.1])2。虽然像PCS这样的综合评分具有反映广泛健康影响的优势,但它可能对健康的一些特定方面(如疼痛)微小但有意义的改善不敏感。尽管如此,该试验2中使用患者报告结局量表有助于研究人员直接从患者的角度了解手术对患者日常生活的影响。

参考文献

1. US Food and Drug Administration. Patient-reported outcome measures. Accessed December 29, 2021. https://www.fda.gov/regulatory-information/search-fda-guidance-documents/patient-reported-outcome-measures-use-medical-product-development-support-labeling-claims

2. Ghogawala Z, Terrin N, Dunbar MR, et al. Effect of ventral vs dorsal spinal surgery on patient-reported physical functioning in patients with cervical spondylotic myelopathy.JAMA. 2021;325(10):942-951.

3. Weinfurt KP, Lin L, Bruner DW, et al. Development and initial validation of the PROMIS® sexual function and satisfaction measures version 2.0.J Sex Med. 2015;12(9):1961-1974.

4. Fayers PM, Machin D. Quality of Life: The Assessment, Analysis, and Reporting of Patient-Reported Outcomes. 3rd ed. John Wiley & Sons Inc; 2016.

5. Copay AG, Glassman SD, Subach BR, et al. Minimum clinically important difference in lumbar spine surgery patients. Spine J. 2008;8(6):968-974.

6. McGlothlin AE, Lewis RJ. Minimal clinically important difference.JAMA. 2014;312(13):1342-1343.

7. Calvert M, King M, Mercieca-Bebber R, et al. SPIRIT-PRO extension explanation and elaboration. BMJ Open. 2021;11(6):e045105.

8. Calvert M, Blazeby J, Altman DG, et al. Reporting of patient-reported outcomes in randomized trials. JAMA. 2013;309(8):814-822.

9. Cruz Rivera S, Aiyegbusi OL, Ives J, et al. Ethical considerations for the inclusion of patient-reported outcomes in clinical research.JAMA. 2022;327(19): 1910-1919.

10. Cao J, Zhang S. Multiple comparison procedures.JAMA. 2014;312(5):543-544.

最后编辑于 2023-04-15 · 浏览 1139

回复6 1

全部讨论0

默认最新
avatar
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部