教学科研|临床研究学习笔记(第三周)
天下难事必作于易,天下大事必作于细。
第十一天 人群基线特征+风锐统计实操与结果解读
一、table 1 表一的作用:
1.评估研究人群的代表性
- 目标人群的匹配性:基本特征数据帮助判断研究人群是否与目标疾病或干预措施的目标人群(如特定年龄、性别或种族群体)一致。若研究人群与目标人群差异较大,结论的外部有效性(可推广性)可能受限。
- 避免选择偏倚:例如,若纳入人群年龄偏大或合并症较多,可能高估或低估干预效果。
2.验证组间可比性(RCT中)
- 随机化成功与否:在RCT中,需确认干预组和对照组在基线时具有相似的基本特征(如年龄、性别分布)。若组间存在显著差异,可能提示随机化失败或需要统计学调整。
- 混杂因素控制:基线特征可用于后续分析中调整潜在混杂变量(如年龄、基线疾病状态)。
3.解释研究结果的合理性
- 亚组分析基础:基本特征是亚组分析(如不同性别、年龄组)的依据,帮助识别干预效果是否因人群特征而异(异质性)。
- 生物学合理性:例如,性别可能影响药物代谢,年龄可能影响疗效或安全性,需通过基线数据解释结果。
4.支持结果的可重复性和科学透明
- 研究复现性:详细的基本特征描述使其他研究者能评估研究条件是否可复制。
- 数据透明性:避免“选择性报告”,确保研究结果的完整性和可信度。
5.满足伦理和监管要求
- 伦理审查:需明确研究人群是否符合伦理批准的范围(如是否纳入弱势群体)。
- 监管提交:药品监管部门(如FDA、EMA)要求提交基线数据,以评估临床试验质量和结果的可靠性。
6.指导临床实践
- 适用性判断:临床医生通过基本特征判断研究结果是否适用于自己的患者群体。例如,若试验人群以年轻患者为主,老年患者疗效需谨慎评估。
二、table 1 表一包括的变量和解读重点
- 人口学特征:关注年龄、性别、种族等变量的均衡性及其对研究结果的影响。
- 疾病特征:分析疾病的分期、严重程度及既往病史,确保基线匹配并评估潜在偏倚。
- 实验室与影像学指标:检查肝肾功能、血糖、血脂等生理指标的均衡性,识别可能的混杂因素。
- 生活方式与环境因素:评估吸烟、饮酒、饮食习惯等对结果的影响。
- 组间均衡性分析:通过统计检验~(如t检验、卡方检验)评估基线特征的差异,决定是否调整混杂因素。
- 样本量与数据完整性:强调样本量是否足够支持亚组分析,基线数据是否存在缺失值及其对结果可信度的影响。
- 结果外推性:评估研究人群是否代表真实世界患者,注意排除标准对适用范围的限制。
- 研究局限性:识别未测量的潜在混杂因素及回顾性研究中的信息偏倚,说明其对结果的影响。
第十二天 回归分析+风锐统计实操和结果解读
一、回归分析方法:是确定≥2种变量间相互依赖的定量关系的一种统计学方法。回归分析用于判断X与Y之间是否存在关联、关联类型及独立关联强度。
- X与Y之间有没有关系
- 统计学意义:P值,95%CI 效应值的具体解读
- 当P<0.05,95%CI未跨0/1
- 当P>0.05,95%CI跨0/1
- X与Y之间有什么样的关系
- 正相关/负相关
- 效应值与0/1的大小
- X与Y关系的独立作用有多少
- 独立关系
- 效应值的具体解读(效应值(OR/RR/HR/β值),95%CI,P值)
- 回归分析使用条件:结局指标Y数据类型。分为3类:
- 线性回归 条件:当结局指标Y为连续变量时使用
- logistic回归 条件:当结局指标Y为二分类变量时使用
- COX回归 条件:当结局指标为二分类,同时有时间变量时使用
- 根据是否控制协变量,分为2类:
- 单因素回归分析:不控制混杂因素,仅用于初步判断暴露与结局的关系。
- 多因素回归分析:通过调整协变量,评估暴露与结局之间的独立关联。


二、回归分析结果解读:
- 根据X和Y变量类型,四选二:()
- X是分类变量
- X是连续变量
- Y是连续变量
- Y是二分类变量

- 效应值(OR,RR,HR,β值),95%CI,P值。




第十三天 曲线拟合+拐点分析
- 曲线拟合用于探索连续变量X与结局Y之间的线性或非线性关系。方法:限制性立方样条函数(RCS),可完成曲线拟合并进行非线性检验(P值判断)。
- 曲线拟合结果需结合横纵坐标解读:横坐标为X(暴露因素),纵坐标为结局效应值。P for non-linearity<0.05,认为暴露与结局之间为曲线关系,否则为线性关系。参考点(reference point)默认为暴露因素中位数,而非拐点值。
- 曲线拟合适用于连续变量X,发现非线性关系后可进一步进行拐点分析。
- 拐点分析通过分段回归确定暴露因素的最佳阈值。拐点分析结果解读:根据拐点值将样本分为两组,分别分析每段的线性关系。结果解读需关注效应值、置信区间及统计学差异(似然比检验)。


第十四天 KM曲线
一、定义:是研究生存资料的一种统计学方法,探索某暴露因素与生存时间和结局关系的方法。核心目标是评价一个群体的“死亡速度”和“死亡率”(生存与死亡不是狭义上的概念,而是是否出现阳性事件)
- “死亡率”或“生存”率:一个群体在规定时间内,“死亡速度”越快,则“死亡”率越高或者“生存”率越低,同时,该生存时间越短。因此,死亡速度、死亡率、生存时间是一事三表,以不周方式展现了研究对象生存状况。生存分析的主要目的就是研究与分析死亡速度、生存率(死亡率)、生存时间。
二、生存分析关键要素在的实际问题
- 数据组成:包括暴露因素(干预措施)、结局事件(阳性事件)和生存时间。
- 结局事件:研究终点,如死亡、疾病复发或耐药等。
- 生存时间:分为完全生存时间和不完全生存时间,后者包括随访截止、中途失访和死于其他原因。

二、生存分析方法:
- KM分析:通过Kaplan-Meier曲线展示暴露组与非暴露组在各时间点的生存率变化。
- COX回归分析:适用于带有随访时间的结局变量,用于探索更复杂的暴露-结局关系。
三、Kaplan-Meier曲线解读

- 图表结构:横坐标为随访时间,纵坐标为生存率,曲线下降表示生存人数减少。
- 辅助信息:Number at risk显示各时间节点上未发生结局的人数;删失数据用加号标记。



- 生成率曲线:从100%开始下降,用于展示不同组在各时间节点上的生存率。
- 累积风险图:与累积事件图类似,但更侧重于风险的累积展示。
- 累积事件图:从零开始上升,表示事件发生累计数量。

第十五天 亚组分析和森林图
亚组分析:将研究对象按基线特征分组,探索暴露与结局的关系。
森林图:可视化展示亚组分析结果,帮助理解不同亚组中的效应值和置信区间。
亚组分析的意义:
- 验证结果稳定性:研究对象由于受到各种国素(如人口学、环境、合并症、合并用药等)的影响,往往具有不同程度的异质性,从而导致X与Y之间的关系在不同特征的研究对象中不同。将具有不同特征的研究对象分组,是探索不同研究对象之间X与Y关系差异的直观方法。检查暴露与结局的关系在不同亚组中是否一致。证明结果稳定:X与Y在总体人群中是存在关联的(阳性结果),我们并不满足于此,还想看看X与Y的关系在某个特定人群是否依然存在(结果稳定)。
- 发现特殊人群:同时亚组分析也可以充分挖据临床研究资料信息,探索特殊人群,为进一步研究提供线索和依据 。识别特定亚组中可能存在不同的暴露与结局关系。X与Y在总体人群中是不存在关联的(阴性结果),我们不死心,还想看看X与Y的关系在某个特定人群中是不是就变了,变得有统计学意义(阳性结果)。
- 控制混杂因素:通过分组控制变量(如性别、吸烟)对暴露与结局关系的影响。


亚组分析的注意事项:
- 临床可解释性:选择具有临床意义的变量进行分组。
- 生物学合理性:确保变量能合理解释暴露与结局的关系。
- 多重比较问题:避免过多分组导致增加P<0.05的检出率,出现加阳性结果,必要时进行多重比较P值的调整。
其实我还是觉得很难。
20250914。