【统计学知识分享】关于生存分析(1)
“生存分析(Survival Analysis)是对一个或多个非负随机变量进行统计推断,研究生存现象和响应时间数据及其统计规律的一门学科。”

生存曲线可绘制试验结果,试验结果是死亡(或其他一次性事件)前的时间。Prism可使用Kaplan - Meier法根据原始数据创建生存曲线,并可对生存曲线作出比较。
生存分析中的关键概念 —— “生存曲线”
在许多临床和动物研究中,结果是生存时间。研究目的是测定治疗是否会改变生存率。Prism使用“Kaplan—Meier法”(即乘积极限法)创建生存曲线,并使用对数秩检验和Gehan - Wilcoxon检验比较生存曲线。
01 删失数据(Censored data)
创建生存曲线其实比想象中要困难。这个困难在于很难清楚地了解各受试者的生存时间。比如,
- 在研究结束时,一部分受试者可能并没有死亡。 你知道到目前为止他们的寿命,但是不清楚会到什么时间结束;
- 有部分受试者中途退出了该项研究。如搬到另座城市、或想要服用现有方案禁止的药物。 这种情况下,你了解这些受试者其实在你的研究中存活了一段特定的时间,但不了解在此之后他们的寿命会到什么时间结束(即使了解也无法使用这些信息。因为他们未遵循既定的实验方案)。
在以上两种情况下,这些受试者的信息均视为“删失(Censored)”。
通常我们不希望直接从分析中删除这些“删失”的观察结果,但需要正确地解释这些数据。我们需要正确的理解“删失(Censored)”的含义,它意味着“不清楚”,或“无法使用超出特定点的生存时间”。Prism在创建和比较生存曲线时,会自动考虑“删失数据”。
02 不仅仅是针对“生存(Survival)”
“生存曲线(Survival Curve)”一词会有点限制性,因为结果可以是任何定义明确的“终点”,每个受试者只能发生一次。除死亡外,终点也可以是血管移植物的闭塞、肿瘤的首次转移或移植肾的排斥。也并非都是可怕的类型,也会包含如肾功能恢复、出院或毕业等。
03 分析其他类型的生存数据
使用非线性回归可以更好地分析其他类型的生存数据。 举个例子,本篇中描述的方法不适合分析细胞存活曲线,该曲线绘制的存活百分比(Y)是各种剂量辐射(X)的函数。
注意:本篇描述的生存分析方法仅在X为时间时有用,且需要知道每名受试者的生存时间。
04 比例风险(Cox)回归
Prism内置的分析可以比较两组或更多组的生存曲线。 但这些方法(对数秩检验,Gehan-Breslow-Wilcoxon检验)无法处理匹配组中受试者的数据,或还希望调整年龄、性别或其他变量的情况。 对于此类分析,需要使用比例风险回归,而Prism不采用该程序。
下一篇中会继续介绍关于“生存分析”的内容。
|| 往期内容回顾
标准效应量(effective size)以及非参数检验的样本量计算
