dxy logo
首页丁香园病例库全部版块
搜索
登录

宫颈恶性转化的序列基因表达分析发现RFC4是一种新的诊断和预后生物标志物

发布于 2022-12-26 · 浏览 824 · IP 山西山西
这个帖子发布于 2 年零 139 天前,其中的信息可能已发生改变或有所发展。

原文出处:一起实验网

原文献下载


背景

宫颈癌的发生是一个复杂的过程,是多种基因组改变的结果。已经进行了一些表达微阵列研究,调查这一过程中的转录组变化。然而,基于下一代测序的研究还很缺乏。

方法

1、从Gene Expression Omnibus(GEO)和ArrayExpress数据库下载GSE63514,GSE27678和GSE7803发现数据集以及GSE138080,GSE75132验证数据集。

2、组织标本(n = 420)来自Fanpu Biotech. Co. (FBC; Guilin, China)、同济医院妇科肿瘤科(TJH; Wuhan, China)和Outdo Biotech. 有限公司。

3、使用R软件包limma在病变和正常组织(分别为LSIL/HSIL/SCC与正常)之间进行差异表达基因(DEG)分析,并对DEG进行功能富集分析

4、对组织进行免疫组织化学分析,使用半定量组织学评分(HSCORE)系统评估SCC中的AURKA,TOP2A和RFC4染色。

5、对3个独立的SCC患者队列(TCGA,n = 252;TJH, n = 56;OBC,n = 106)进行生存分析。

6、计算皮尔逊或斯皮尔曼的相关系数以确定双变量相关性。数值变量采用学生t检验、威尔科克森秩和检验、单因素方差分析检验和克鲁斯卡尔-瓦利斯检验。

结果

1、宫颈病灶间和病灶内异质性评估

主成分分析(PCA)表明,GSE63514中正常和LSIL没有明显区分。然而,在其他数据集中,正常和其他疾病阶段之间存在明显的区别。不一致的结果可能是由于正常组织中的HPV状态不同。与未感染HR-HPV的正常上皮相比,LSIL与HR-HPV感染的正常上皮的相似性更高(图2A,附加文件1:表S1)。计算相应分期病例基因表达谱的成对相关系数,以测量病灶内异质性。在GSE63514中,我们观察到与HSIL,LSIL和正常相比,SCC的相关性显着降低(平均Pearson的r:0.91 vs. 0.94 vs. 0.94 vs. 0.93,所有p<0.05),反映了SCC的分子病灶内异质性。GSE7803也获得了类似的结果(图2B)。成对样本的相关热图表明无创鳞状上皮样本之间存在一定的相似性(图2C)。

img

图2

2、DEG鉴定和细胞带富集分析

为了进一步探索致癌过程中的转录景观,我们分别对LSIL,HSIL,SCC和正常组织(LSIL / HSIL / SCC 与正常:LN,HN,CN)进行了差异表达分析。LN中已确定的DEG数量有限,随后进展增加(图2D)。一方面,我们在HN和CN的发现数据集中观察到DEG的合理一致性表示,表明结果的可靠性。另一方面,GSE63514显示出最高的研究特异性DEG比例(HN:78.5%,CN:84.0%),其中约三分之一可以用平台特异性基因来解释(图2 E,F)。鉴于上述原因,我们应用“交叉研究”分析,为每个比较(包括LN_UP/DN、HN_UP/DN和CN_UP/DN,称为基因集1)分别生成上调和下调基因的联合,以组合来自多个独立微阵列数据集的数据。


基因集1的染色体图谱揭示了全基因组分布,具有高频染色体畸变的区域含有更特异性的DEG(图2G)。失调基因显著聚集在1q21、1q32、2q31、3q、8q13、12q13、17q21、19q13和19p13上,对应于先前报道的HPV整合或与宫颈癌相关的CNV区域。有趣的是,之前描述为扩增区域的1q21和19q13显示出下调基因的富集。在HN和CN中观察到富集的染色体条带3q13和19q13,在LN中仅观察到17q21(图2H,附加文件2:表S7)。

3、宫颈癌发生的功能和信号转换

基因集1和总DEG的GO富集揭示了HN和CN的相似富集模式。确定了八个不同的簇,每个簇都被分配了一个独特的富集特征(图3A)。我们观察到HN和CN的上调基因对细胞周期表现出强烈的富集(簇1,3,4)。细胞周期项的正向调控富含LN_DN、HN_UP/DN和CN_UP基因,表明细胞周期控制的动态调控。与整个疾病进展过程中角质形成细胞的不成熟一致,HN 和 CN 基因下调在角化项中显示出显着富集(第 8 类)。此外,LN_UP基因在任何方面均未富集,而LN_DN基因主要富集于簇1,5-8(图3A,附加文件2:表S8)。

img

图3


 总DEG的KEGG富集表明HN和CN之间非常一致。在下调基因富集时,HN似乎是一种过渡状态,因为HN的富集途径与CN和LN的富集途径部分重叠(附加文件1:图)。S3)。DNA修复途径[同源重组(HR),碱基切除修复(BER),核苷酸切除修复(NER)和错配修复(MMR)],细胞周期相关途径(细胞周期,DNA复制和细胞衰老)和致癌p53信号通路富含HN和CN的上调基因(图3B,附加文件2:表S9)。LN和HN的下调基因富集在更多的癌症相关通路(例如,MAPK,ErbB,PI3K / AKT,TGF-β和Wnt信号通路)中比CN富集。上述一些途径,如PI3K/AKT和Wnt途径,在考虑总DEG时也可以富集CN(图3B,附加文件2:表S9)。

人T细胞白血病病毒1(HTLV-1)感染和免疫相关IL-17信号通路在DEGs的所有疾病分期均富集(图3B)。富含HTLV-1感染信号传导的HN和CN的许多DEG是细胞周期相关基因,其中大多数是上调的。HTLV-1感染信号传导中的10个基因在LN中差异表达,所有血清反应因子(SRF)通路基因(SRF,FOS,FOSL1,EGR1和EGR2)均参与并下调(附加文件1:图)。S4,附加文件 2:表 S9)。IL17细胞因子家族包括IL17A、IL17B、IL17C、IL17D、IL17E(也称为IL25)和IL17F。在这些细胞因子基因中,只有IL17C在HN和CN中差异表达(下调)(图3C,附加文件2:表S9)。IL17C主要由角质形成细胞产生,在恶性转化中逐渐被异常上皮细胞取代。尽管Th17相关细胞因子基因(IL17A和IL17F)未受影响,但我们仍然观察到Th17细胞在癌症进展晚期的丰度显着降低(图3D),这与先前的发现不一致[41]。

4、鉴定与致癌作用相关的潜在基因

为了识别关键的DEG并为癌前病变的早期诊断和干预提供线索,我们应用“跨阶段”分析为每个发现数据集(称为Gene Sets2)生成DEG和“逐步基因”的交集。通过对Sets2基因的PPI网络分析,至少两个数据集中出现的四个基因(AURKA,TOP2A,CEP55和RFC4)被认为是“枢纽基因”(图4A,附加文件1:图)。S5)。在从正常到SCC的进展过程中,Hub基因表达显着增加(均p <0.05,附加文件1:图。S6),这也在GSE138080中得到了验证(所有p <0.05,图4B)。此外,这些基因已被证明参与几种不同类型的肿瘤的恶性转化,如巴雷特腺癌、结直肠癌、头颈部鳞状细胞癌(HNSCC)等。正如预期的那样,他们倾向于显示肿瘤进展的线性表达模式(附加文件1:表S10)。

img

图4


观察到的疾病阶段依赖性表达变化可能由多种因素诱导,例如遗传和表观遗传改变,小RNA和HPV整合。本研究评估了AC和SCC中枢纽基因表达水平与相应拷贝数改变(CNA)之间的关联。我们发现 RFC4 的表达水平和 CNA 之间存在很强的正相关(斯皮尔曼的 rho:0.70 和 0.80,所有 p < 0.05),以及 AC 和 SCC 的 AURKA(斯皮尔曼的 rho:0.65 和 0.44,所有 p < 0.05)和 CEP55(斯皮尔曼的 rho:0.40 和 0.42,所有 p < 0.05)的中等相关性(图 4C)。TOP2A的CNA在促进基因表达变异性方面具有肿瘤亚型特异性作用。AC显示这两个参数之间的相关性比SCC更紧密(Spearman的rho:0.50对0.17,图4C)。

此外,我们在一项前瞻性队列研究(GSE75132)中检查了枢纽基因的表达水平是否可预测发生高级别宫颈病变。该研究招募了HPV阴性和持续感染HPV16的女性。HPV感染妇女根据随访期间是否进展到CIN3+分为进展组(HPV-P)和维持组(HPV-S)(附加文件1:表S1)。我们注意到HPV-P女性中RFC4和TOP2A的中位表达水平高于HPV-S和HPV阴性女性的趋势。HPV-P和HPV阴性女性之间的表达差异分别显著或略有显著(RFC4的p = 0.034,TOP2A的p = 0.08,图4D)。

5、HSIL和HSIL+枢纽基因的诊断评估

枢纽基因的分层聚类显示正常/ LSIL和HSIL+(HSIL和SCC)之间具有良好的分离(图5A)。因此,我们对p16进行了IHCINK4a、Ki-67 和四个枢纽基因,以验证蛋白质水平上鉴定的转录组变化,并探索其在诊断 HSIL 和 HSIL+ 中的临床实用性。对应于mRNA的变化,所有测试标记的蛋白质表达从正常逐渐增加到CIN3(图5B,附加文件1:表S11)。由于评分系统不同,我们无法通过IHC评分比较正常/CIN和SCC之间的标记表达。然而,根据主观视觉估计,鳞状细胞的肿瘤性上皮细胞比CIN3的肿瘤性上皮细胞表现出更强的染色(增加的阳性强度和更多的弥漫表达)(图5B)。

img

图5

细胞标志物根据其生物学功能分为三类,包括细胞周期调节标志物(p16INK4a,AURKA,RFC4),细胞分裂标记(CEP55)和增殖标记(Ki-67和TOP2A)。然后,我们开发了一个单独的评分系统来评估染色强度和程度(附加文件1:图。S7,表S5)。所有标志物的阳性率随着宫颈病变的严重程度而显著增加,特别是在HSIL和SCC中(图5C)。对于 p16INK4a和Ki-67,我们的结果与以前的研究非常吻合,这提高了对IHC可靠性和评估可比性的信心。同时,还收集了先前报道的宫颈病变中TOP2A和ProExC阳性(MCM2和TOP2A)的频率(附加文件1:表S12)。一致性分析表明,Ki-67和TOP2A在整个阶段的一致性为90.2%(κ = 0.8),HSIL的一致性为97.1%(κ = 0.84)(图5D,附加文件1:表S13)。

为了检测HSIL,六种标志物的灵敏度,特异性,PPV,NPV和AUC显示在附加文件1:表S14中。值得注意的是,具有高灵敏度和低特异性的CEP55和AURKA由于其细胞质染色而被排除在进一步比较分析之外,这使得评估具有挑战性和解释困难。为了统计比较其余标记物的诊断效用,分析了同时评估这些标记的切片(附加文件1:表S15,表1)。数据显示 p16 的灵敏度最高INK4a,但特异性和PPV较低。与 p16 相反INK4a,Ki-67 和 TOP2A 提供了几乎相同的灵敏度(92.6% 对 91.2% 对 88.2%,均 p > 0.05)和更高的特异性(63.4% 对 80.2% 对 87.1%,所有 p < 0.05)。加入Ki-67可以提高p16的特异性(87.1%对63.4%,p<0.05),PPV(82.2%对63%)和准确性(AUC,0.88对0.78)。INK4a(图5E),以牺牲灵敏度(92.6%至88.2%)和NPV(92.8%至91.7%)为代价。TOP2A的性能与p16相同INK4a和 Ki-67 组合。此外,RFC4不仅具有相同的灵敏度(88.2%对88.2%,p = 1 )和相对更高的特异性(90.1对87.1%,p = 0.58),而且比p16的组合具有更高的准确度(AUC,0.89对0.88;图5E)。INK4a和 Ki-67。同时,RFC4和TOP2A检测HSIL+的诊断效果有所提高,AUC分别达到0.91和0.89(表1)。这些结果表明,单独的RFC4和TOP2A可能是p16的互补替代标记。INK4a和Ki-67用于检测HSIL和HSIL+。


此外,将任何标记对的串行和并行解释与单独的TOP2A和RFC4进行比较(附加文件1:表S16)。TOP2A 和 RFC4 在并行解释中的组合具有最高的准确度(AUC,0.90),与 RFC4 相比,检测 HSIL 的灵敏度显着更高(97.1 vs 88.2%,p < 0.05),但特异性较低(82.2 vs 90.1%,p < 0.05)。在检测HSIL+方面,没有一种组合比RFC4具有某些优势(附加文件1:表S16b)。

6、鳞状细胞癌枢纽基因的预后评估

为了进一步研究枢纽基因在SCC进展中的临床影响,我们检查了TCGA队列中鳞状细胞癌患者的表达与疾病严重程度之间的相关性。分析显示,AURKA mRNA表达增加与晚期FIGO分期(p = 0.039)、较高的组织学分级(p = 0.01)和淋巴结转移(p = 0.088;附加文件 1:图S8)。

接下来,我们评估了枢纽基因表达改变对三个独立SCC患者队列预后的影响(参见“方法”部分)。在TCGA队列(n = 252)中,高AURKA mRNA表达与OS呈负相关(log-rank,p = 0.017;图6A)。而较高的RFC4 mRNA表达与更好的OS和PFI显著相关(对数秩,分别为p = 6.8e−04和p = 7.8e−03;图6A,附加文件1:图。S9A)。为了在蛋白质水平上验证这一发现,我们对TJH队列(n = 56)的SCC组织对这些基因进行了免疫染色。RFC4蛋白的过表达与OS和DFS增加有显著关联(对数秩,分别为p = 3.1e−03和p = 1.5e−03;图6B,附加文件1:图。S9B)。此外,较高的TOP2A蛋白表达与更好的DFS显著相关(对数秩,p = 0.019;附加文件 1:图S9B),在mRNA水平上没有发现。虽然没有统计学意义,但在TCGA队列中,与PFI(对数等级,p = 0.1)增加和TJH队列中DFS(对数排名,p = 0.072)增加相关的CEP55表达有较高的趋势(图6B,附加文件1:图)。S9B)。由于TJH队列的样本有限,我们进一步研究了TJH和OBC联合队列中的RFC4预后值(扩展队列,n = 162;附加文件 1:图S10)。正如预期的那样,RFC4蛋白表达对OS和DFS的影响仍然显着(对数秩,分别为p = 1.6e−04和p = 2.2e−04;图6C,附加文件1:图。S9C)。鳞状细胞癌中枢纽基因的代表性IHC染色图像如图6D所示。

img

图6

值得注意的是,多变量Cox回归分析显示,在调整年龄、FIGO分期、分级和队列后,RFC4表达(mRNA和蛋白质)成为三个队列中SCC患者临床结果(OS、PFI和DFS)的独立预测因子(图6E,附加文件1:图)。S9D)。时间依赖性AUC表明,在Cox比例风险模型中加入RFC4表达显著提高了2年和3年OS的预后有效性(均p <0.05; 图6F),对于1年、2年和3年DFS(均p < 0.05;附加文件 1:图S9E)。

原文出处:一起实验网

原文献下载

最后编辑于 2022-12-26 · 浏览 824

1 1 点赞

全部讨论0

默认最新
avatar
1
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部