生信分析 肿瘤单基因
HTRA3 Is a Prognostic Biomarker and Associated With Immune Infiltrates in Gastric Cancer
HTRA3是一种预后生物标志物,与胃癌的免疫浸润有关
haha pmid: 33425760 2020.12.23 Frontiers in Oncology (IF:4.848)
摘要
HtrA serine peptidase 3(HTRA3)参与多种信号通路,并在多种恶性肿瘤中起着重要的调节作用,但其在胃癌预后和免疫浸润中的作用尚不清楚。本研究探讨了HTRA3在肿瘤组织中的表达及其与免疫浸润的关系,确定其在胃癌患者中的预后作用。胃癌患者信息来自肿瘤基因组图谱(TCGA)。采用Wilcoxon rank sum test检验比较HTRA3在胃癌组织和正常胃粘膜组织中的表达。应用logistic regression回归分析HTRA3与临床病理特征的关系。基因本体(GO)术语分析、基因集富集分析(GSEA)和单样本基因集富集分析(ssGSEA)被用来解释HTRA3的富集途径和功能,并量化其免疫细胞浸润的程度。采用Kaplan-Meier分析和Cox regression回归分析探究HTRA3与生存率的相关性。基于Cox multivariate analysis多变量分析的列线图用于预测HTRA3对预后的影响。HTRA3高表达与肿瘤组织学类型、组织学分级、临床分期、T分期和TP53状态显著相关(P < 0.05)。基于多变量分析的列线图的C指数和校准图表明对胃癌患者具有有效的预测性能。GSEA显示HTRA3高表达可能激活NF-κB通路、YAP1/WWTR1/TAZ通路和TGFβ通路。HTRA3的表达与适应性免疫细胞的丰度呈负相关(T helper cell 17 cells) 与天然免疫细胞丰度呈正相关(natural killer cells, macrophages etc.)。HTRA3在胃癌进展和预后中起着重要作用,可作为预测胃癌术后生存率的一个适度生物标志物。
背景
HtrA Serine Peptidase 3 (HTRA3) 是一个位于染色体4p16.1上的蛋白质编码基因。先前的研究表明HTRA3可能通过降解某些细胞外基质蛋白多糖进而间接抑制TGFβ家族蛋白介导的。在一份研究中,HTRA3首次被证明与癌症有关,该研究证明它可能是一种肿瘤抑制因子。同时有研究表明HTRA3过表达会抑制TGFβ1的致癌作用,从而抑制非小细胞肺癌早期的转移。也有研究表明HTRA3表达与乳腺癌淋巴结转移呈负相关。因此最近的研究表明它是一种肿瘤启动子。这些发现表明HTRA3在多种恶性肿瘤中具有多方面的功能作用。此外,HTRA3在肿瘤进展和肿瘤免疫学中的潜在功能和机制尚不清楚。本研究旨在系统分析HTRA3在胃癌中的作用。
材料和方法
数据来源与预处理
从TCGA收集STAD项目(包括32个正常组织和375个肿瘤组织)的基因表达数据和临床信息。排除正常样本和总生存期小于30天的样本。将level 3 HTSeq-FPKM数据转换为TPM。375例胃癌患者的TPM数据用于进一步分析。不可用或未知的临床特征被视为缺失值。
TCGA胃癌组织HTRA3的差异表达
以疾病状态(肿瘤或正常)为变量,生成箱线图和散点图,计算HTRA3的差异表达。利用receiver operating characteristic(ROC)曲线评价结果好坏。通过HTRA3表达高于或低于中值来定义高表达HTRA3或低表达HTRA3。
利用qPCR和Western Blotting在胃癌组织和细胞系中验证HTRA3的差异表达
用收集的44个人类胃癌样本和非恶性胃组织进行实验验证,其中非恶性胃组织样本距离肿瘤样本至少5厘米。
HTRA3高表达组与低表达组间的DEGs分析
通过DESeq2(3.8)数据包中unpaired Student’s t-test检验确定TCGA数据集中HTRA3高和HTRA3低患者之间的DEG。校正P值小于0.05和绝对FC大于1.5的基因被认为具有统计学意义。在热图和火山图中显示了所有的DEGs。
免疫细胞浸润的功能富集与分析
在本研究中,Metascape ( http://metasape.org) 作为分析HTRA3相关DEG富集过程和途径的工具。阈值条件包括:P <0.01, a minimum count of 3, and the enrichment factor >1.5 。
GSEA分析从HTRA3差异表达矩阵开始,分析HTRA3高、低组间信号通路的差异,预测HTRA3相关表型和信号通路。permutation test检验设置为1000次test,用来识别显著改变的路径(Adjusted P <0.01 and FDR <0.25)。使用R软件包clusterProfiler进行统计分析和图形绘制。DEG的结果输入STRING数据库, 选择PPI pairs with an interaction score>0.95的PPI用来构建PPI网络。
用ssGSEA法测定24种免疫细胞的相对肿瘤浸润水平。特征基因包括适应性和先天性免疫细胞类型,总共包含509个基因。为了探讨HTRA3与免疫细胞浸润水平的相关性,以及免疫细胞浸润与HTRA3不同表达群的关系,采用Wilcoxon rank sum test检验和Spearman correlation相关分析方法。
预后、模型构建和评估的临床统计分析
所有统计分析均在R (V3.6.2)中进行。采用Wilcoxon signed-rank sum test和logistic regression分析临床病理特征与HTRA3的关系。应用Cox regression和Kaplan-Meier方法分析TCGA患者10年总生存率(OS)、无进展期(PFI)和疾病特异性生存率(DSS)的临床病理特征。多因素Cox分析比较HTRA3表达与其他临床特征(分期、肌层浸润、淋巴结状况、远处转移状况、组织学分级和亚型)对生存率的影响。HTRA3表达的临界值由其中值决定。在所有试验中,小于0.05的P值被认为是显著的。采用Kaplan-Meier method with a two-sided log-rank test检验计算HTRA3高,低组间的10年OS、PFI和DSS的差异。
以Cox回归模型为基础,用多因素分析得到的独立预后因素建立nomograms。RMS软件包(Version: 5.1-4; https://cran.r-project.org/web/packages/rms/index.html) 用来生成nomogram图。通过将nomogram图预测的概率与观察到的事件对应起来,以图形方式评估校准曲线,45°线代表最佳预测值。用一致性指数(C-index)确定nomogram图的判别,并用bootstrap方法(1000次重采样)计算。使用C指数比较nomogram图和单独预后因素的预测准确性。在本研究中,所有统计检验均为双尾检验,统计学显著性水平设定为0.05。
结果
HTRA3在胃癌中异常高表达
首先,利用Wilcoxon rank sum test检验在正常和肿瘤样本中进行泛癌分析,样本数据从GTEx和TCGA两个数据库中获得。HTRA3在23种癌症中显著表达(图1)

图 1 在TCGA和GTEx数据库中,与正常组织相比,不同癌症的HTRA3增加或减少。
接着,我们比较了32例癌旁组织和375例胃癌组织中HTRA3的表达。HTRA3在胃癌样本中的表达显著增高(P=0.002)(图2 B)。然而,在27个胃癌样本和匹配的癌旁样本中,HTRA3的表达没有显著差异(p=0.117)(图2 C),这可能是由于TCGA数据库中成对样本的数量较少所致。因此,我们扩大配对样本的数量,以验证胃癌组织和细胞系中HTRA3的mRNA和蛋白质差异表达。我们通过对44对GC样本和癌旁样本进行QPCR(P=0.0035)和WB分析(P=0.0013),证实了HTRA3在GC组织中高表达。在GC细胞中,htra3 mRNA和蛋白的表达在MGC803、HGC27和MKN45细胞中相对较高,在SGC7901细胞中最低。采用ROC法分析HTRA3对胃癌组织与正常胃粘膜组织的鉴别效果。HTRA3的曲线下面积(AUC)为0.710,表明HTRA3可能是GC组织中潜在的鉴定分子(图2 D)。

识别胃癌的差异基因
我们比较了187个胃癌-HTRA3高的样本和188个对照-HTRA3低的样本。共有607个DEGs,包括299个上调基因和308个下调基因,在这两个cohorts中具有统计学意义(adjusted p-value < 0.05, |Log2-fold change| > 1.5)(图3 E)。用DESeq2软件包进一步分析HTSeq计数中的DEGs。两组间前10个DEGs的相对表达值在图中展示(图3 F)。

图 3
HTRA3相关基因在胃癌中的功能富集与分析
为了预测HTRA3相互作用基因的功能富集信息,我们采用Metascape进行GO富集分析,结果表明HTRA3相关基因参与了许多生物过程(BPs)、细胞组成(CCs)和分子功能(MFs)(图4 A)。

图 4
蛋白质相互作用(PPI)网络分析
为了获得GC组中607个DEGs之间的相互作用,使用STRING数据库构建了一个PPI网络,并将相互作用阈值设置为0.90。从PPI网络中筛选出319个蛋白质和1425个边缘,利用得大于6600的条件筛选出4个hub基因簇。前10位的hub基因包括IVL、TGM1、SPRR3、SPRR2A、SPRR2E、SPRR2D、LCE3E、SPRR2B、LCE3D和SPRR2G。
GSEA识别HTRA3相关的信号通路
为了在胃癌中鉴定HTRA3相关的信号通路,对HTRA3高表达和低表达数据集进行GSEA分析。根据其标准化富集分数(HES)选择最显著富集的信号通路。其富集结果在图中展示。(图5)

图 5
HTRA3表达与免疫浸润的关系
用spearman correlation分析HTRA3表达水平(TPM)与ssGSEA测定的免疫细胞浸润水平的相关性。HTRA3的表达与获得性免疫细胞的丰度呈负相关[helper T17 (Th17) cells, T helper cells, T central memory cells, etc.],与天然免疫细胞丰度呈正相关[natural killer (NK) cells, tumor-associated macrophages (TAMs), immature dendritic cells, etc.](图6)

图 6 HTRA3的表达水平与肿瘤微环境的免疫浸润的关系。
HTRA3表达与临床病理变量的关系
为了阐明HTRA3表达的作用和意义,我们从TCGA收集了375份胃癌样本,分析了所有患者的HTRA3表达数据。研究对象包括241名男性和134名女性,平均年龄61.1岁(51-69岁)。HTRA3高表达与肿瘤组织学类型(粘液型与管状型,P=0.003)、组织学分级(3级与1、2级,P<0.001)、临床分期(IV期与I期,P<0.001)、T期(T4期与T1期,P<0.001)和TP53状态(野生型与突变型,P=0.014)显著相关(图7 A-E)。HTRA3的表达与其他临床病理特征无关(图7 F-I)。Logistic regression回归的单变量分析显示HTRA3表达作为分类因变量与预后不良的临床病理特征相关。胃癌中HTTA3表达增加与T分期(T3和T4与T1和T2相比,OR=2.39)、组织学分级(G3与G1和G2相比,OR=2.14)呈正相关;同时与TP53状态(突变与野生型相比,OR=0.59)呈显著负相关(P<0.05)。结果表明,高表达HTRA3的胃癌患者比低表达HTRA3的胃癌患者更容易进展到晚期,并且对TP53突变的敏感性更低。

图 7 HTRA3表达与临床病理特征的关系
HTRA3高表达与GC患者预后不良密切相关
HTRA3低表达组的10年生存率明显高于HTRA3高表达组(37.6 vs. 24.7%; P = 0.006)(图8 A)。同样,HTRA3低表达组的10年PFI率和DSS显著高于HTRA3高表达组(图8 B,C)。在OS的III-IV期、III期、T4期、N2和N3期以及M0亚组和DSS的M0亚组中,HTRA3高的患者预后较差(图8 D-I)。值得注意的是,M0亚组HTRA3高的GC患者OS和DSS较差(33.2 vs. 22.7%; P = 0.019; 54.3 vs. 37.2%; P = 0.029)。单变量logistic回归分析表明,HTRA3高表达与短OS[hazard ratio (HR): 1.590; 95% confidence interval (CI):1.140–2.219; P = 0.006]和低PFI(HR:1.456;CI:1.021–2.078;P=0.038)以及DSS(HR:1.650;CI:1.079–2.522;P=0.021)相关。为了进一步寻找与生存相关的因素,我们对病理分期、T分期、N分期、M分期、组织学分级、年龄、主要治疗结果和肿瘤残留情况进行了多因素Cox回归分析。HTRA3的高表达仍然是一个与低OS相关的独立因素(HR:2.315;CI:1.447–3.703;P<0.001)。然而,在胃癌患者中,HTRA3表达水平与差DSS(HR:1.405;CI:0.824–2.395;P=0.211)和短PFI(HR:1.116;CI:0.656–1.898;P=0.686)无关。基于多变量Cox分析选择的独立不良预后因素,我们研究了不同亚组中HTRA3表达对预后(OS、PFI和DSS)的影响。在T4亚组(HR: 2.130; CI: 1.106–4.104; P = 0.024)、N2和3亚组(HR: 1.979; CI: 1.214–3.227; P = 0.006)、M0亚组(HR: 1.536; CI: 1.075–2.196; P = 0.019)、病理III亚组(HR: 2.244; CI: 1.040–4.838; P = 0.039)和病理III和IV亚组(HR: 1.546; CI: 1.013–2.357; P = 0.043)。同样,DSS预后分析显示,M0亚组中HTRA3高GC患者的生存时间较短(HR: 1.665; CI: 1.055–2.627; P = 0.029)。然而,PFI预后分析没有发现HTRA3表达的差异对任何亚组的预后有显著影响。

图 8 胃癌中高、低表达HTRA3的Kaplan-Meier生存曲线
基于HTRA3的Nomogram图的构建与验证
为了提供一个定量的预测GC患者预后的方法,HTRA3和独立的临床危险因素被用来构建一个Nomogram图(图 9 A)。在基于多变量Cox分析的列线图中,使用点标度为这些变量赋值。分配给每个变量的点数的总和被调整到1到100的范围内。将各变量的得分进行累加,记为总分。GC患者1年、3年和5年的生存率是通过从总分轴直接向下画一条垂直线到结果轴来确定的。例如,一名具有高HTRA3风险(45分)、淋巴结转移(42.5分)和不良治疗结果(37分)的GC患者的总分为124.5分。1、3、5年生存率分别为87.5%、57%和38%。并对Nomogram图的预测效率进行了分析,结果表明该模型的C指数为0.743(CI: 0.720–0.766)。在calibration校正图中的bias-corrected line偏倚校正线与理想曲线(45度线)接近,预测值与观测值吻合较好(图9 B)。HTRA3的Nomogram图表现(C-index: 0.743)优于T期(C-index: 0.698)、M期(C-index: 0.677)、病理期(C指数0.722)。这些结果表明,Nomogram图是预测GC患者短期或长期生存率的一个更好的模型。

图 9
总结
在本研究中,首次报道了HTRA3的高表达与胃癌进展、生存率低和免疫浸润密切相关,可能通过异常的炎症和免疫反应促进肿瘤的发生。HTRA3具有预测治疗效果的潜力,有望成为GC的一个新的生物标志物。HTRA3促进胃癌进展和转移的机制有待进一步研究证实。本研究为进一步阐明其临床病理意义和分子生物学意义提供了新的思路。