基于转录组分析的阿尔兹海默病免疫浸润和泛凋亡相关分子簇的识别与预测模型|Ibrain

点击此处即可免费获取论文原文
摘要:本研究旨在探究阿尔茨海默病(AD)中泛凋亡相关基因(PRGs)的表达谱和免疫浸润情况。基于基因表达谱数据库,本研究分析了AD中差异表达的PRGs和免疫细胞浸润,并探讨了相关分子簇。采用基因集变异分析(GSVA)分析不同簇中基因本体和京都基因与基因组百科全书的表达。利用加权基因共表达网络寻找网络中的共表达基因模块和核心基因。通过分析随机森林、支持向量机、广义线性模型和极端梯度提升(XGB)的交集基因,确定了XGB模型。最终,选取XGB模型中的前五个基因(信号转导和转录激活因子3、肿瘤坏死因子(TNF)受体超家族成员1B、白介素4受体、氯离子内通道1、TNF受体超家族成员10B)作为预测基因。本研究探讨了泛凋亡与AD的关系,并建立了用于评估和筛选关键基因的XGB学习模型。同时,免疫浸润分析显示,AD存在不同的免疫浸润表达谱。

1. 前言
阿尔茨海默病(AD)是痴呆症的主要原因,它已迅速成为本世纪最具负担、致命和昂贵的疾病之一。AD的发病机制涉及许多机制,例如,生活方式行为(如不良饮食和体力活动减少)以及环境和代谢风险因素(包括糖尿病、脑血管疾病、颅脑损伤和压力)通常与疾病风险增加有关。值得注意的是,导致蛋白质编码错误的基因突变被认为是AD的关键因素,因为由淀粉样蛋白前体蛋白、前体蛋白酶1和前体蛋白酶2编译的三个基因的显性基因突变与某些AD病例有关。AD的标志性神经病理学特征包括淀粉样β蛋白(Aβ)在脑实质和脑血管系统中的沉积,以及神经元中突触的逐渐丧失和神经纤维缠结的增加。更重要的是,AD的发生与神经元细胞死亡有着重要联系,Söllvander等人发现,Aβ在星形胶质细胞中的积累导致微泡诱导的核内体和神经元凋亡增加。其他研究还发现,核相关蛋白会在AD的早期引发依赖性坏死。还有报道指出,AD的发生与其他细胞死亡模式有关,包括细胞凋亡、坏死性凋亡、热性凋亡、铁死亡、依赖性细胞死亡和吞噬作用。虽然这些发现强调了AD与细胞死亡之间的密切关系,但泛凋亡(一种新发现的细胞死亡形式)的潜在参与仍有待阐明。
泛凋亡涉及局灶性死亡、细胞凋亡和坏死性细胞凋亡之间的相互作用和协调。以坏死性凋亡、细胞凋亡和细胞焦亡为特征,泛凋亡不能单独用它们中的任何一个来解释。这种新颖的细胞死亡机制因其与神经炎症和神经退行性疾病的潜在相关性而受到关注。有研究发现,脓毒症可导致大鼠皮质细胞发生泛凋亡。另一项研究也发现,拮抗泛凋亡可以起到神经保护作用。在AD的情况下,重度痴呆患者的内嗅皮层可以观察到CASP1、CASP3、CASP6、CASP7、CASP8和CASP9的表达增加,这表明局灶性死亡或细胞凋亡可能无法单独解释AD细胞死亡的全貌。因此,泛凋亡的出现为我们解释AD细胞死亡提供了有力的参考,但目前尚无泛凋亡在AD中的详细报道。
生物信息学整合了生物学、计算机科学和数学的原理和方法,从大规模生物数据中提取有意义的信息。它有助于理解生物分子的结构、功能、调控机制和相互作用,以及生物体组织、发育、进化和疾病的基本原理,包括转录组学、基因组学、蛋白质组学等。免疫浸润分析是一种研究和评估疾病中免疫细胞的存在和分布的方法。通过检测和定量分析免疫细胞的类型、数量和激活状态来揭示免疫系统在疾病发生和发展中的作用。目前,上述方法已被用于研究肿瘤和非肿瘤疾病,并确定疾病的免疫细胞表达。因此,基于生物信息学和免疫浸润分析,我们通过对免疫细胞浸润的研究,探索了AD中泛凋亡的关键调控基因和相关通路(图1)。

图1. 本研究流程图。AD,阿尔茨海默病;GEO, 基因表达综合数据库;GLM,广义线性模型;GSVA,基因集变异分析;PCA,主成分分析;PRGs,泛凋亡相关基因;RF,随机森林;SVM,支持向量机;WGCNA,加权基因共表达网络分析;XGB,极端梯度增强。
2. 方法
2.1 数据处理
从基因表达综合数据库(GEO)中提取GSE33000和GSE122063,并使用Perl处理这两个数据集。GSE33000数据集作为实验组,其中包括157例来自健康个体的脑组织样本(对照组)和310例AD患者脑组织样本(AD组)。作为验证组,GSE122063数据集包含44例健康个体的脑组织样本和56例AD患者的脑组织样本。对两组数据进行了标准化分析后,通过Genecard 和PubMed 获取泛凋亡相关基因(PRGs)。本研究还使用R语言(版本4.3.1)进行分析。
2.2 鉴定AD患者差异表达的PRGs并构建PRGs圆图
利用R语言“limma”构建基于GSE33000数据集的PRGs矩阵,探索健康人和AD患者PRGs的表达变化,并检测差异表达的PRGs(p < 0.05)。然后分别使用“ggpubr”和“pheatmap”构建箱线图和热图。应用“corrplot”分析差异PRGs的相关性及基因关系。同时,利用“RCircos”构建染色体上PRGs的圆图,标记PRGs在染色体数目上的起止位置信息,探索PRGs在染色体上的分布情况。
2.3 免疫细胞浸润的评估
利用“CIBERSORT算法”和“白细胞特征矩阵(LM22)”评估单个样本中22种免疫细胞类型的比例。LM22可作为描述各种白细胞亚群的基因表达特征矩阵,提供22种免疫细胞类型的基因表达数据,从而能够评估样品中这些免疫细胞类型的相对丰度。蒙特卡洛抽样通过随机抽样来估计概率分布或计算数值积分,从而计算出每个样本的p值。只有当免疫细胞成分的p < 0.05时,才被认为是准确的。
2.4 PRGs与免疫细胞之间的相关性
分析PRGs与免疫细胞特征之间的相关系数,可以为PRGs表达与免疫细胞相对比例之间关系的提供新的证据。Spearman相关分析是一种用于评估两个变量之间非线性关系的统计方法,p < 0.05被认为是有统计学差异。最后,使用R语言“ggpubr”、“limma”、“reshape2”和“tidyverse”对结果进行分析和可视化。
2.5 AD中浸润免疫细胞的差异分析
免疫细胞和AD差异分析的目的是更好地验证对照组和AD组之间哪些免疫细胞存在差异,并且p < 0.05具有统计学相关性。使用R语言中“reshape”和“ggpubr”对结果进行分析和可视化。
2.6 基于差异 PRGs 表达水平的样本聚类
基于差异PRGs的表达水平,使用R语言“ConsensusClusterPlus”对数据进行聚类并评估聚类的稳定性。“K-means”算法通过1000次迭代,将实验组中的310个样本分配到最近的聚类中。通过定义k值(范围从1到9)生成不同的子类型。根据聚类的一致性得分,选择最佳聚类数量。采用主成分分析(PCA)来减少特征维度并最大限度地减少聚类分布的信息损失。同时,基于R语言“limma”和“ggplot”绘制箱线图和热图,对不同簇中的基因表达进行。
2.7 分型后免疫细胞的差异
免疫细胞和不同簇的差异分析的目的是验证哪些免疫细胞在不同簇之间存在差异,p < 0.05被认为是具有统计学意义。箱线图和热图用于可视化结果。
2.8 基因集变异分析(GSVA)
GSVA 已成为RNA-seq数据基因组富集的宝贵方法。它主要依赖于从MSigDB获取的R语言“GSVA”、“c2.cp.kegg.symbols.gmt”和 “c5.go.symbols.gmt”。p < 0.05表示统计学差异。
2.9 加权基因共表达网络分析 (WGCNA)
WGCNA是一种系统的生物学方法,用于描述不同样本之间的基因关联模式,可以识别那些具有高度协同变化的基因集。该方法可以通过分析基因集的互连性及其与表型的关系来找到潜在的生物标志基因或治疗靶点。选取方差位于前1/4的基因进行WGCNA分析。然后,对各模块进行功能富集分析,并与表型进行相关性分析,识别与特异性状相关的模块,从而进一步探究各模块在不同样本中的特异性表达,并基于聚类文件重建WGCN。
2.10 获取交集基因
基于R语言“VennDiagram”从DiseaseWGCNA中的关键基因和的ClusterWGCNA靶基因中获取交集基因。
2.11 机器学习模型构建
结合交集基因数据和GSE33000数据集,采用R语言“caret”建立随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)和极端梯度提升(XGB)模型。利用R语言“pROC”构建的受试者工作特征(ROC)曲线可以很容易地找出任意阈值对学习者泛化表现的影响。最后,选择最佳的机器学习模型,并选择前5个基因作为AD中的枢纽基因,利用GSE122063数据集来验证ROC曲线的诊断价值。
2.12 生成风险列线图
前5个基因被视为预测因子。根据结果,使用R语言中“rms”预测这5个预测因素的风险评分并构建列线图。确定每个预测因子的分数,并将所有预测因子的分数之和定义为“总分”。通过校准曲线分析和决策曲线分析(DCA)评估和验证列线图的预测性能。
2.13 预测模型基因与临床特征之间的相关性
腰大肌指数(PMI)是一种用于评估医学成像中肌肉质量和数量的测量值,计算方法是在CT扫描中测量患者特定水平的腰椎横截面积除以身高的平方。AD作为一种常见的神经退行性疾病,主要影响老年人。一些研究发现,低PMI可能与糖尿病、心血管疾病和代谢综合征等慢性疾病的风险增加有关,可以作为评估老年人肌肉状况、身体机能和健康状况的重要指标。此外,PMI在许多恶性肿瘤中的预后价值也有报道。更重要的是,PMI是肌肉减少症的一种直观表现,这已被证明与认知能力下降有关,并且似乎与AD的严重程度相关。因此,本文以PMI作为AD的临床特征,探讨其与预测基因的相关性。基于R语言“ggplot2”、 “ggpubr”和“ggExtra”对模型筛选出的疾病预测基因与临床信息PMI进行相关性分析。p < 0.05表示两个变量之间存在统计学意义的相关性。
2.14 统计分析
使用R语言(版本4.3.1)进行数据处理。采用“cor.Test”函数进行Spearman相关性分析,并分析PRGs表达水平与免疫细胞的关系。P < 0.05为差异具有统计学意义。
3. 结果
3.1 数据下载与处理
从GEO数据库下载GSE33000和GSE122063数据集,经Perl处理后得到两个数据集的矩阵文件。通过R语言“limma”进行标准化后,得到两个数据集的标准化文件。将GSE33000作为实验组,GSE122063作为验证组。我们从Genecards和PubMed中获得了47个PRGs(表1)。使用标准化的GSE33000数据集,我们提取了PRGs表达矩阵。

表1. 泛凋亡基因在染色体上的定位信息。
3.2 AD中差异表达PRGs的鉴定及PRGs圆图
为了明确PRGs在AD进展中的作用,利用GSE33000数据集分析PRGs在AD个体和健康个体之间的表达变化。我们发现24个PRGs在这两组之间表现出差异表达模式(图2A)。在AD患者中,CASP1、RIPK3、CASP4、CASP8、CASP5、PYCARD、CASP6、RIPK1、CASP10、CASP7、FADD、TNF、MEFV、CASP2、AIM2、CASP12、MAPK3和NINJ1的表达水平上调,而NLRP3、DFNA5、ADAR、DNM1L、NFS1和IFNG的表达水平下调(图2B,表2)。我们对这些差异表达的PRGs进行了相关性分析,以检验泛凋亡调节因子在AD发展中的相互作用(图2C)。其中,RIPK3与RIPK1、CASP5与CASP4、CSAP5与CASP1、CASP1与CASP4、PYCARD与NINJ1、CASP1与CASP7、CASP4与CASP7、CASP6与CASP7表达呈正相关。PYCARD与ADAR、PYCARD与DNM1L、NINJ1与NFS1、NINJ1与DNM1L的表达呈负相关,其中CASP1与CASP4的相关性最强(图2D)。同时,我们整合了PRGs在染色体编号上的起始位置和结束位置信息,并绘制了圆图(表1,图2E)。PRGs主要分布在1、2、4、6、7、8、9、10、11、12、14、16、17、19、20、22号染色体上,其中主要集中在1、2、11、16号染色体上,这4条染色体上至少有3个基因。

图2. AD患者中差异表达PRGs的识别。(A)热图呈现PRGs的表达水平。共有24个PRGs被鉴定为差异表达的泛凋亡基因。(B)箱线图显示24个PRGs在对照组和AD组之间的表达水平。(C和D)24个差异表达PRGs的相关性分析。红色和绿色分别代表正相关和负相关。(E)差异表达的泛凋亡基因的染色体环图。AD,阿尔茨海默病;Control,正常组;PRGs,泛凋亡相关基因;*p < 0.05, **p < 0.01, ***p < 0.001。

表2. AD中差异基因的表达。
3.3 AD的免疫浸润
为了阐明AD组和对照组之间的免疫差异,我们进行了免疫浸润分析。CIBERSORT分析显示,22种免疫细胞在AD组和健康组之间的分布存在多样性(图3A)。AD组的浆细胞、T细胞CD8、滤泡辅助性T细胞和自然杀伤(NK)细胞显著减少,而T细胞CD4初始、T细胞CD4记忆静息、NK细胞静息、单核细胞、巨噬细胞M2和中性粒细胞增多(图3B)。此外,我们发现PRGs与各种免疫细胞类型有显著的相关性,包括记忆B细胞,初始B细胞,活化树突状细胞,静息树突状细胞,嗜酸性粒细胞,M0,M1和M2巨噬细胞,活化的肥大细胞,静息肥大细胞,单核细胞,中性粒细胞,活化的NK细胞,静息的NK细胞,浆细胞,活化的记忆CD4+ T细胞,静息的CD4+ T细胞,初始CD4+ T细胞,CD8+ T细胞,滤泡辅助性T细胞,γ δ T细胞,以及调节性T细胞(Tregs)。其中,中性粒细胞与大多数差异PRGs显著相关,尤其是与CASP4和CASP5(图3C)。PRGs可能通过免疫细胞浸润在AD的进展中发挥调节作用,其中中性粒细胞可能是关键的免疫细胞。

图3. AD的免疫细胞浸润分析。(A)CIBERSORT分析显示AD组和对照组之间22种浸润免疫细胞类型的丰度存在差异。(B)箱线图显示了对照组和AD组之间免疫浸润的差异。(C)24种差异PRGs与浸润免疫细胞的相关性分析。红色和蓝色分别代表正相关和负相关。AD,阿尔茨海默病;Control,正常组;PRGs,泛凋亡相关基因;*p < 0.05, **p < 0.01, ***p < 0.001。
3.4 AD中的PRGs集群
基于24个PRGs的表达量,采用共识聚类算法对310例AD样本进行聚类。当k值设为2时,我们观察到最优的聚类数量,累积分布函数(CDF)曲线的一致指数在0.2 ~ 0.6之间(图4A,B)。当k值为2 ~ 9时,两条CDF曲线(k和k-1)之间存在变化(图4C)。当k值为2时,各亚型的一致性最高(图4D)。PCA分析显示,310个AD样本可分为C1(n = 120)和C2(n = 190)簇,且差异显著(图4E)。

图4. AD中与泛凋亡相关的分子亚型的鉴定。(A)当k值设为2时集群数最稳定。(B)CDF曲线波动在共识指数0.2 ~ 0.6的最小范围内。(C)CDF曲线下面积表示两条CDF曲线之间的差异。(D)当k = 2时,各亚型的一致性评分最高。(E)PCA在两类患者间存在显著差异。310例AD患者可分为C1(n = 120)和C2 (n = 190),差异具有统计学意义。AD,阿尔茨海默病;CDF,累积分布函数;PCA,主成分分析。
3.5 C1和C2间PRGs表达及免疫浸润的差异
综合评估24个PRGs在C1和C2之间的表达差异,并探讨不同基因簇之间的分子特征。热图显示了C1和C2簇之间差异PRGs的表达水平差异(图5A)。具体来说,CASP1、RIPK3、CASP4、CASP8、CASP5、PYCARXD、CASP6、RIPK1、CASP10、CASP7、FADD、TNF、MEFV、CASP2、AIM2、CASP12和NINJ1在C2中高表达,而NLRP3、DFNA5、ADAR、MAPK3、DNM1L和NFS1在C1中高表达(图5B)。此外,对免疫细胞浸润的分析表明,C1和C2之间存在显著差异(图5C)。CD8+ T细胞、T细胞调节性、活化的NK细胞和M0巨噬细胞在C1中高表达,而静息的NK细胞、M2巨噬细胞和中性粒细胞在C2中高表达
3.6 GSVA富集分析
GSVA确定了C1和C2相关的通路活性和生物学功能。京都基因与基因组百科全书(KEGG)通路分析显示,“阿尔茨海默病”、“血管加压素调节的水重吸收”、“牛磺酸和次牛磺酸代谢”在C2中受到正调控并显著富集。“Jak stat信号通路”、“造血细胞谱系”和“病毒性心肌炎”在C1中显著富集(图6A)。基因本体(GO)富集分析显示,“无机磷酸盐跨膜转运蛋白活性”、“突触的结构组成”和“内吞循环的调节”富集于C2,而“减数分裂细胞周期相变”的调节、“Torc2信号”和“受体结合的调节”富集于C1(图6B)。

图6. 两个PRG簇之间的生物学功能和通路活性。(A)根据GSVA方法的t值排序,C1和C2样本之间标志通路活性的差异。(B)根据GSVA方法的t值排序的C1和C2样本分子功能和生物学过程的差异。GSVA,基因集变异分析;PRGs,泛凋亡相关基因。
3.7 WGCNA模块识别及共表达网络构建
利用WGCNA筛选与AD相关的关键基因模块。选取GSE33000数据集中变异最大的前25%基因进行WGCNA。通过动态切割算法识别出11个颜色明显的模块。同时构建拓扑重叠矩阵(图7C)。在这些模块中,包含759个基因的蓝色模块与AD表现出最强的相关性(图7A),蓝色模块与“群体”性状表现出最稳健的相关性(图7B)。此外,通过WGCNA算法分析与PRGs簇密切相关的关键基因模块,通过同样的方法得到11个共表达模块(图7F)。模块-临床特征分析(C1和C2)证明了黑色模块(35个基因)和AD簇之间存在高度的相关性(图7D)。结果表明,黑色模块与“群体”性状(C1和C2)表现出最显著的相关性(图7E)。最终,通过使用R语言“Venn”,在蓝色和黑色模块重叠的基因中识别出了13个基因(图7G,表3)。

图7. 鉴定与AD相关的基因模块和共表达网络。(A)对照组和AD组中模块特征基因之间的相关性分析。蓝色模块中的基因与AD的关系最为显著。(B)蓝色模块中基因的散点图。(C)AD中的聚类树状图。根据动态树切割,通过阈值0.25的层次聚类将基因分为不同的模块。每种颜色代表每个模块。(D)两个聚类之间的模块特征基因的相关性分析。模块-临床特征关系分析显示黑色模块与AD簇高度相关。(E)黑色模块中基因的散点图。(F)两个簇的聚类树状图。根据动态树切割,通过阈值0.25的层次聚类将基因分为不同的模块。每种颜色代表每个模块。(G)疾病WGCNA和聚类WGCNA的交集基因的识别。两个模块的交集产生了13个基因。AD,阿尔兹海默病;WGCNA,加权基因共表达网络分析。

表3. 疾病型WGCNA与聚类WGCNA的交叉基因。
注:黑色和粗体为筛选的中心基因。
3.8 XGB机器学习模型
利用GSE33000数据集的特定细胞群差异表达的PRGs,开发了4个机器学习模型(RF、SVM、GLM和XGB)。使用R语言“DALEX”来解释这些模型。使用验证数据集可视化每个模型的残差分布。RF和XGB的残差较低(图8A、B)。之后再根据均方根误差(RMSE),获取了前10个基因(图8C)。此外,通过在GSE33000数据集中使用五重交叉验证生成ROC曲线,评估了四种机器学习算法的区分性能(图8D)。获得4种模型的ROC曲线下面积(AUC)(RF: AUC = 0.893;SVM: AUC = 0.900;XGB: AUC = 0.905;GLM: AUC = 0.889)。基于以上数据,XGB模型的性能最好。最后,从XGB模型中选取了前五个基因(信号转导和转录激活因子3(STAT3)、TNF受体超家族成员1B(TNFRSF1B)、白细胞介素4受体(IL4R)、氯离子内流通道1(CLIC1)、TNF受体超家族成员10B(TNFRSF10B)作为进一步分析的预测基因(见表4)。

图8. 预测AD的机器学习模型的构建和评估。(A和B)每个机器学习模型的残差分布。XGB和RF机器学习模型的残差较低。(C)机器学习模型的重要特征。根据均方根误差对各模型前10个特征的基因进行测序。(D)测试队列中基于五重交叉验证的四种机器学习模型的ROC分析。获得了4种模型的AUC(RF: AUC = 0.893;SVM: AUC = 0.900;XGB: AUC = 0.905;GLM: AUC = 0.889)。AD,阿尔茨海默病;AUC: ROC曲线下面积;GLM,广义线性模型;ROC:受试者工作特征曲线;RF,随机森林;SVM,支持向量机;XGB,极限梯度提升。

表4. XGB模型筛选枢纽基因。
3.9 列线图模型构建
基于GSE33000数据,绘制列线图评估310例AD样本中5个基因的临床风险(图9A)。使用校准曲线和DCA评估列线图的预测性能,显示了预测和实际结果之间的一致性(图9B,C)。DCA柱状图显示了显著提高的准确性,提供了积极的临床影响(图9C)。

图9. 验证基于5个基因的机器学习模型预测AD的效果。(A)基于5基因XGB模型构建预测AD集群风险的列线图。(B)校准曲线的构建。校准曲线分析显示实线靠近虚线,提示列线图准确度较高。(C)决策曲线的构建。DCA显示红线远离灰线,提示列线图的准确性相对较高。AD,阿尔茨海默病;DCA,决策曲线分析;XGB,极限梯度提升。
3.10 XGB模型的评价
使用GSE122063数据集验证XGB模型的精度。在GSE122063数据集中,XGB模型中包含5个基因(STAT3、TNFRSF1B、IL4R、CLIC1和TNFRSF10B)的ROC曲线显示出良好的性能(AUC = 0.745)(图10A)。根据临床特征,采用5个基因预测基因与AD PMI的关系(图10B-F),其中CLIC1与AD PMI显著相关(r = 0.34;p = 0.0094)(图10F,表5)。

图10. AD患者独立数据集中基因表达与疾病状态的相关性分析。(A)XGB模型5个基因的ROC曲线。XGB模型的5个基因的ROC曲线表现出良好的性能(AUC = 0.745)。(B-F)5个基因与AD患者临床特征PMI的相关性。CLIC1与PMI相关(R = 0.34;p = 0.0094)。AD,阿尔茨海默病;AUC: ROC曲线下面积;PMI,腰肌指数;ROC:受试者工作特征曲线;XGB,极限梯度提升。

表5. Hub基因与PMI的相关性研究。
注:p < 0.05为有统计学意义。
4. 讨论
本研究在AD组和正常组之间获得了24个差异PRGs。310例AD患者根据其表达水平可分为C1(n = 120)和C2(n = 190),使用PCA验证了聚类的准确性。免疫浸润显示C1高表达CD8+ T细胞、T细胞调节性、活化的NK细胞和M0型巨噬细胞,而C2高表达静息的NK细胞、M2型巨噬细胞和中性粒细胞。GSVA确定了与C1和C2相关的通路活性和生物学功能,KEGG通路分析显示AD在C2中显著富集,而Jak stat信号通路在C1中显著富集。GO富集分析显示,无机磷酸盐跨膜转运活性在C2中正富集,而减数分裂细胞周期相变的调控在C1中富集。WGCNA分析筛选出分别代表疾病和集群核心基因的蓝绿色模块和黑色模块富集的关键基因,以及13个交集基因。基于交集基因,最终确定XGB模型。筛选出5个Hub基因:STAT3、TNFRSF1B、IL4R、CLIC1和TNFRSF10B。验证性ROC曲线的AUC值为0.745,证明模型构建成功。
4.3 AD和PRGs的免疫浸润
比较AD组和对照组的免疫浸润,我们发现浆细胞、T细胞CD8、辅助性T细胞、NK细胞、CD4初始T细胞、CD4记忆静息T细胞、NK细胞静息T细胞、单核细胞、M2型巨噬细胞和中性粒细胞在AD中有重要作用。Agrawal等发现AD患者IL-21水平的升高增加了Tfh和浆细胞的商,降低了有助于减轻炎症和清除Aβ的浆细胞率。有研究也检测了外周血中T细胞CD8,发现AD组的表达水平低于正常组。TYROBP作为NK细胞的受体激活亚基,在AD中被敲除,导致NK细胞活化性降低,静息性增加在AD中,Aβ可募集单核细胞进入大脑,从而限制脑淀粉样变性。M2型巨噬细胞浸润与AD呈正相关。在Aβ斑块附近或远处观察到AD患者脑中性粒细胞的增加。Xu等分析了AD组和正常组的数据,发现AD组的CD4+T细胞高于正常组,然而没有关于AD和T细胞跟随辅助性T细胞的详细报道。综上所述,明确免疫细胞在AD中的表达可为AD的治疗提供参考。同时,对PRGs与免疫细胞的相关性分析显示,M2型巨噬细胞、中性粒细胞与PRGs基因均存在显著相关性,其中中性粒细胞与CASP4、CASP5的相关性最强。Binet等发现,三氧化二砷在内质网应激下激活了多形核中性粒细胞中的CASP4,但中性粒细胞与CASP5、M2型巨噬细胞和panptosis的相关报道尚未见报道。总之,免疫细胞与PRGs之间存在相关性,提示PRGs可能调控AD患者的分子和免疫侵袭状态。
4.4 不同簇的聚类与免疫浸润
基于24个PRGs差异基因的聚类分析,310例AD患者被分为C1和C2。C1与C2的差异分析显示,CASP1、RIPK3、CASP4、CASP8、CASP5、PYCARXD、CASP6、RIPK1、CASP10、CASP7、FADD、TNF、MEFV、CASP2、AIM2、CASP12、NINJ1在C2中高表达,而NLRP3、DFNA5、ADAR、MAPK3、DNM1L、NFS1在C1中高表达。免疫浸润分析显示,CD8+T细胞、活化的NK细胞、T细胞调节性细胞和M0巨噬细胞在C1中高表达,表明C1以免疫细胞的活化和分化为特征;静息NK细胞、M2巨噬细胞和中性粒细胞在C2中呈高表达,提示C2簇相关的免疫细胞主要与AD的促炎、抗炎和清除异物有关。综上所述,C1和C2簇之间的免疫细胞表达存在差异,不同的免疫细胞在不同簇中发挥不同的功能。
4.5 C1和C2的GSVA分析
GSVA富集分析发现AD通路显著富集于C2,JAK/STAT信号通路显著富集于C1簇。AD通路是AD的典型通路。已有研究报道其与牙髓干细胞的衰老有关JAK/STAT信号通路的紊乱与多种癌症和自身免疫性疾病相关。JAK/STAT信号通路通过启动先天性免疫、协调适应性免疫机制并最终限制神经炎症反应,是促进AD的关键因素之一。综上所述,AD的发生涉及许多途径,包括不同的机制,可通过不同的靶点导致疾病的发生。通过GSVA 对GO富集分析发现C2富集了无机磷酸盐跨膜转运蛋白活性和突触的结构成分,C1富集了减数分裂细胞周期相变的调控。突触作为神经元之间的重要组成部分,在AD中最先受到影响。值得注意的是,在C2中富集的突触的结构成分强调了突触完整性在AD进展中的重要性。因此,葛根、葛根素等能够通过促进培养神经元的轴-树突轴和突触的形成来提供神经营养支持的化合物能够缓解AD的发生。受体结合调节作为受体影响AD发生的一种生物调节功能,在C1中富集。研究发现TNF受体结合蛋白DENN/MADD的下调与AD患者大脑和海马神经元细胞死亡有关。综上所述,C2患者可能与神经元结构的破坏和Aβ的产生有关,而C1患者主要与细胞死亡受体的结构改变和细胞的生长发育有关。
4.7 Hub基因的临床验证
列线图预测各枢纽基因对AD发病的影响具有较好的准确性,证明各基因在AD的发生中具有一定的作用。最后,基于STAT3、TNFRSF1B、IL4R、CLIC1和TNFRSF10B,验证PMI与5个基因在AD中的相关性。发现只有CLIC1与PMI相关。PMI是一种客观、简单、准确的营养状况指标在老年患者中,PMI可作为老年创伤患者病死率和发病率的预测因素,也是老年冠心病患者不良结局的预测因素。此外,Kobori将PMI作为衰弱的新兴指标,成功验证了PMI可以预测老年重症监护患者的拔管结局。总之,PMI越来越多地用于评估和预测老年患者的疾病状态。目前,PMI与AD之间更直接的关系尚未见报道,值得后续学者进一步研究。
虽然我们的研究为PRGs在AD中的潜在作用提供了有价值的见解,但有几个局限性需要承认。首先,本研究依赖于生物信息学分析,需要进一步的临床或实验验证来证实PRGs在AD中的表达水平。此外,还需要更多的临床特征来提高预测模型的有效性和弹性。最后,PRGs和免疫浸润之间的潜在相关性尚未完全阐明。
5. 结论
本研究揭示了PRGs和浸润的免疫细胞之间的联系,并证明了AD患者在不同的泛凋亡相关簇中显著的免疫多样性。模型建立后筛选出STAT3、TNFRSF1B、IL4R、CLIC1和TNFRSF10B作为AD的预测因子。综上所述,本研究阐明了PRGs和AD免疫浸润之间的关系,并通过先进的机器学习模型确定了关键的预测基因,从而增强了我们对AD发病机制和潜在治疗靶点的理解。
最后编辑于 01-13 · 浏览 1191