一文浅析非编码RNA起源及功能


1 背景知识介绍
目前确定的编码RNA大约为20000个左右,占总基因组序列的 < 2%时,人类基因组的测序让许多人感到惊讶 [8]。基因表达是生命各个方面所需的中心过程,其调控定义了所有细胞和组织的发育和稳态。该过程的核心组成部分是位于细胞核中的基因组DNA,作为信使RNA(Messenger RNAs, mRNA)转录的模板,mRNA转位到细胞质中,并作为蛋白质翻译的蓝图。这些过程需要几类非蛋白质编码 RNA (Non-protein coding RNAs, ncRNA) 才能发挥作用: 小核 RNA (Small nuclear RNAs, snRNA) 主要参与mRNA的剪接事件。转移RNA(Transfer RNAs, tRNA) 反密码子通过特异性识别 mRNA 的密码子(三核苷酸序列)并以正确的顺序将氨基酸募集到核糖体(Ribosome),将 mRNA 序列解码为肽或蛋白质。核糖体RNA(Ribosomal RNAs, rRNA) 被认为代表细胞中最丰富的RNA分子,并形成核糖体的框架,核糖体是蛋白质翻译所必需的大分子结构。这些管家RNA组成型表达,对细胞的正常功能至关重要。这些管家 RNA(Housekeeping RNAs) 的很大一部分可能带有化学修饰,这些修饰由一类小核仁 RNA (Small nucleolar, snoRNA) 添加 [1-2]。
1990 年代小调节性 ncRNA 的发现彻底改变了我们对 ncRNA 作为调节分子的理解。Andrew Fire、Craig Mello等人可以证明,小的双链RNA(dsRNA)能够通过一种称为RNA干扰的过程介导线虫秀丽隐杆线虫中互补mRNA的转录后基因沉默[3,4]。 快速的内源性 dsRNA,例如小干扰 RNA (siRNA) 和microRNA(miRNA) 存在于多种生物体中,如植物、苍蝇和哺乳动物。近年来,越来越多的新的调节性小RNA类别被发现[5],其中piwi相关RNA 、miRNA和siRNA属于迄今为止研究得最好的类别 [1]。

(图1 RNA分类-编码RNA和非编码RNA)
2 miRNA介绍
microRNAs (miRNAs)是一种长度为17 - 24bp的小RNA分子,通过调节mRNA的翻译和稳定性,在基因表达调控中发挥重要作用 [6]。miRNA和短干扰RNA (short interfering, siRNA)通过结合靶mRNA的3' -UTR介导RNA干扰(RNA interference, RNAi),导致翻译被抑制或mRNA衰变(decay)。这种内源性调控系统是由miRNA和mRNA靶序列之间的不完全互补介导的。miRNA调节所有组织的细胞功能并控制发育和分化,此外,它们是多种信号级联反应的一部分,也可以改变细胞周期。
miRNA成熟过程中,首先初级miRNA(primary miRNA, Pri-miRNA)转录本由核糖核酸内切酶(endoribonuclease)Drosha处理。由此产生的前体miRNA被转运到细胞质中,并被Dicer切割成24bp的片段。将双链miRNA::miRNA*片段加载到RNA诱导沉默复合体(RISC)中后,miRNA*被降解。含有成熟miRNA的RISC结合靶mRNA,通过抑制翻译或mRNA降解来抑制翻译。

(图2 miRNA的成熟与靶向mRNA 示意图)
3 lncRNA简介
哺乳动物基因组通过RNA聚合酶II介导的转录表达两个主要基因类别:蛋白质编码转录单元和非编码RNA转录单元。非编码RNA进一步分为相对丰富的结构RNA,如小核RNA,以及无数通常丰度低、稳定性低的非编码RNA(ncRNA) [7]。长链非编码RNA(Long non-coding RNA, lncRNA)是长度大于200个核苷酸的非编码 RNA,研究表明,lncRNA 在剂量补偿效应(Dosage compensationeffect)、表观遗传调控、细胞周期调控和细胞分化调控等众多生命活动中发挥重要作用,成为遗传学研究热点。
目前,lncRNA位点有三个主要功能原理(图3):(1)RNA是功能性生物分子,并与细胞中的其他成分相互作用,例如DNA,蛋白质或RNA,(2)基因调节元件嵌入lncRNA基因的转录体中,lncRNA基因的活性指导调节元件的活性,或(3)转录过程影响基因组,从而影响基因活性。lncRNA位点可以具有这些功能之一或它们的混合物[9-10]。

(图3 编码蛋白质的基因(PCGs)和LncRNA转录产物产生的区别特征(A) LncRNA和(B) mRNA: LncRNA基因表达较低,因为较少的转录因子(TF)结合启动子)
lncRNA基因的基因调控–转录单元内的调控元件:对染色质和DNA修饰的研究导致了整个基因组中潜在调控区域的注释,有时甚至是特定组织和细胞类型的调控区域。在转录单元内具有明确调节元件的 lncRNA 的一个很好的例子是 ThymoD lncRNA 位点。它的转录可防止位于其转录单元内的CTCF结合位点的甲基化(图4A).CTCF 的结合允许 Bcl11b 转录单元在与 Bcl11b 激活区域相同的结构域中循环。当 ThymoD 的转录入 pA 信号阻断时,这种激活会丢失,在外显子之后和 CTCF 结合位点之前插入,因此 CTCF 结合位点被甲基化 (图4A).因此,转录活性对Bcl11b 的调节具有间接的结构性影响,而 ThymoD RNA 是可有可无的 [11-12]。

(图4 lncRNA转录调节基因表达)
lncRNA的基因调控–转录行为:转录单元内缺乏调节元件可能是由于注释不完整或与该位点结合的未知因子,或者转录起始或转录延伸行为对 lncRNA 位点的功能很重要。这种调控原理的一个例子来自XIST lncRNA的工作,XIST lncRNA是已被广泛研究的原始lncRNA之一。而XIST通过产生的RNA起作用,至少部分地对XIST的调节没有。XIST lncRNA位点两侧有许多lncRNA,其中一个是在Xist上游140 kb处发现的Ftx位点。然而,详细分析发现,Ftx的转录,而不是产生的RNA,对于调节Xist很重要。敲低Ftx RNA 不会导致 Xist 表达丢失,但 Ftx 启动子的缺失以及随之而来的 Ftx 转录丢失会导致 Xist 表达丢失。Ftx 的 CRISPRi 同样会导致 Xist 表达的丧失,这表明 Ftx 的转录是 Xist 表达的正调节因子。一种可能性是,由于基因组位点的转录活性(图5).引人注目的是,Xist 和 Ftx 的发起人两侧是 CTCF 占领的位点。然而,单独删除 Ftx 启动子处的 CTCF 结合位点对 Xist 的表达水平没有影响,认为 Ftx 活性诱导的基因组折叠不涉及 CTCF 结合 [10]。

(图5 lncRNA活性改变基因组相互作用。DNA:DNA接触可以改变附近顺式lncRNA基因的转录活性。)
4 piRNA
PIWI 相互作用 RNA (piRNA) 及其相关的 PIWI 分支 Argonaute 蛋白构成了 piRNA 通路的核心。在性腺细胞中,这种保守的途径对基因组防御至关重要,其主要功能是沉默转座元件,这是通过转录后和转录基因沉默来实现的。产生piRNA的前体需要专门的转录和转运机制,因为piRNA的生物发生是一个细胞质过程。 Ping-pong cycle是一种转录后沉默机制,将转座子RNA的切割依赖性沉默与piRNA的产生相结合。PIWI 蛋白也在细胞核中发挥作用,在那里它们扫描具有序列互补性的新生靶转录本,指示转录沉默和转座子位点抑制性染色质标记的沉积 [11]。
piRNA的生物发生历来分为两个不同的分支:作用于簇转录本的初级生物发生和针对转座子mRNA的Ping-pong cycle(也称为次生)。最近的研究结果对这种分离提出了挑战,表明这两条途径相互关联,Ping-pong触发了原代piRNA的产生 (图6)。

(图6 piRNA生物发生遵循的几种机制 [11])
核PIWI蛋白的沉默反应是RNA依赖性的,不被认为是由DNA的直接识别介导的。通常被认为是抑制性的染色质修饰发生在 PIWI 靶向位点;然而,这些是否是TGS的原因或后果仍有待研究。染色质修饰包括组蛋白修饰,例如去除 H3K4me2 和沉积 H3K9me2/3。在哺乳动物生殖细胞中,PIWI 引导的 TGS 除了沉积抑制性组蛋白标记外,还会导致 CpG 二核苷酸位点的 DNA 甲基化 [12]。从概念上讲,TGS可以分为几个阶段。首先,靶RNA与PIWI-piRNA复合物结合(起始);其次,染色质沉默机制将因子募集到基因座。这个过程最终导致转录失活状态。

(图7 piRNA主要功能建立示意图)
5 tsRNA
tRNA衍生的小非编码RNA(tsRNA)是非编码RNA(ncRNA)家族的成员,可分为应激驱动的RNA(tiRNA)和tRNA片段(tRF)。根据5个“或3”序列的存在,tRF可以进一步分离为5'-tRF和3'-tRF,而tiRNA可以在5'-tiRNA和3'-tiRNA中分离。根据限制性位点,tRF可以裂解成许多亚型,如tRF-5a、tRF-5b、tRF-5c、tRF-3a、tRF-3b和tRF-2]。tsRNA在不同的调控机制下发挥着不同的生物学功能,影响人类疾病进展的各个阶段。同时,在各种信号分子的调控下,tsRNA参与遗传和表观遗传调控、RNA沉默、转录和逆转录调控、RNA稳定性调控和翻译调控 [13]。
tsRNA来源于tRNA,是长度为18-40个核苷酸(nt)的短链ncRNA,通过加工成熟的tRNA或tRNA(pre-tRNA)的前体而形成。不同的tRNA来源和酶切割位点使tRNA能够形成一系列具有各种结构和作用的tsRNA,这些tsRNA属于tRF和tiRNA。在这些tRF中,5'-tRF(14-30 nt)和3'-tRF(18-22 nt)分别通过5'和3'末端随机产生。如图8所示,1、在tRNA成熟过程中,在RNase P和RNase Z的影响下,细胞核内pre-tRNA的5'和3'末端被切除;因此,RNase Z特异性核酸内切酶裂解催化3'末端产生tRF-1(14–30 nt)。D环上的切割位点,包括tRF-5a(14-16 nt)、tRF-5b(22-24 nt)和tRF-5c(28-30 nt),以及T环(包括tRF-3a和tRF-3b、5'-tRF和3'-tRF),反映了tRNA成熟结构产生5'-tRF的位置。tiRNA 长 31-40 个核苷酸,通过切割反密码子环产生。这些 tiRNA 通常分为 5'-tiRNA 和 3'-tiRNA 两半。i-tRF (18–50 nt) 和 tRF-2 是通过在 T 和 D 环内的两个位点同时切割产生的 [13]。

(图8 tsRNA的起源和分类。从5'和3'端衍生的trf称为5'-tRF和3'-tRF。在细胞核中的前tRNA中,RNase z特异性核内裂解催化3 '端产生tRF-1。在成熟的tRNA结构中,5'-tRF可以在D环上的切割位点被切割,包括tRF-5a、tRF-5b和tRF-5c。3’-tRF可以在T环的裂解位点产生,包括tRF-3a和tRF-3b, 5’-tRF和3’-3’-tRF。tirna是在反密码子环上切割形成的,可分为5'-tiRNA和3'-tiRNA。i-tRF和tRF-2是在T环和D环的两个位点同时切割形成。)
6 circRNA
共价闭合环状RNA(Covalently closed circular RNAs, circRNA)是通过真核生物中数千个基因的外显子的前体mRNA反向剪接产生的,以前认为circRNA是mRNA的剪接错误造成的,随着研究的深入,这种观点已经被推翻。 circRNA通常以低水平表达,并且通常表现出细胞类型特异性和组织特异性模式。最近的研究表明,它们的生物发生需要剪接体机制,并且可以受到顺式互补序列和蛋白质因子的调节。大多数circRNA的功能在很大程度上仍未被探索,但已知的功能包括microRNA或蛋白质的隔离、转录的调节和剪接的干扰,甚至翻译以产生多肽。
据报道,各种环状RNA是通过不同的机制产生的。管家非编码RNA,包括小核仁RNA (small nucleolar RNA, snoRNAs)和RNase P RNA,在古细菌中以环状形式被发现。环状RNA中间体也可以在rRNA加工过程中产生,或者在古细菌和藻类中重组片段的排列tRNA。从分支内含子脱支中逃脱的RNA中间体也可以形成环状RNA。尽管存在这些不同形式的环状RNA,但目前研究的大多数环状RNA (circRNAs)是由外显子的前体mRNA (pre-mRNA)反剪接产生的,其中下游的5'剪接位点(splice site)与上游的3'剪接位点(splice site)连接,由此产生的RNA环在连接位点通过3'-5'磷酸二酯键连接 [14]。

(图9 circRNA生物合成过程示意图)
circRNAs是由前体mRNA通过RNA聚合酶II产生的,通过RNA聚合酶II, 3'端剪接位点与上游5'端剪接位点连接形成闭环,称为反剪。基于circRNA的组成,circRNA环形成有三种模式:内含子配对驱动、rna结合蛋白(RBP)驱动和larient驱动环形成。根据其基因组起源和循环机制,circRNAs可分为ecirnas、ciRNAs和eIciRNAs。环状RNA主要来源于pre-mRNA的单个或多个外显子。这些ciRNAs是通过剪接体介导的剪接从内含子衍生而来的。EIciRNAs由外显子和内含子序列组成[21]。rbp在circRNA的生物发生中发挥作用,而作用于RNA的腺苷脱氨酶(ADARs)通过A-to-I取代参与circRNA的形成 [15]。

(图10 环状rna的生物发生和功能机制。a,线性mRNA是通过传统的剪接过程产生的。b,circRNAs生物发生的内含子配对模型;外显子上的3 '剪接供体位点与上游内含子上的5 '剪接受体位点结合,通过去除外显子之间的内含子形成环状rna或环状rna。c,内含子配对驱动的环状化;反向互补序列(Alu序列)直接插入并通过内含子移除或保留产生EIciRNA或ecircRNA。d,rbp诱导的环化:rbp协助反剪接事件,其中内含子被移除以形成环状rna。e, ciRNA形成;ciRNAs来自于喉内含子。f,环状rna可以作为miRNA海绵。g,circRNAs可以与crbp相互作用并改变蛋白质的功能。h,环状rna可以编码多肽和蛋白质。i, ciRNAs可以直接与转录复合物相互作用,从而在转录和翻译水平上调控亲本基因的表达。)
7 结束。
(爱自己!!!做科研!!! 每文格言作家刘娜说:“江湖不过一阵喧闹,大闹一场,都要退场。人生不过一场修行,持戒而行,方得始终。”如果有用,关注楼主GBhouse,点赞+讨论,攻击型人格请请请不要关注和阅读!!!)
参考:
[1] Non-coding RNAs: Classification, Biology and Functioning.
[2] Non-coding RNAs: lessons from the small nuclear and small nucleolar RNAs.
[3] Wnt Signaling and an APC-Related Gene Specify Endoderm in Early C. elegans Embryos.
[4] Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans.
[5] Small RNA sorting: matchmaking for Argonautes.
[6] Next Generation Sequencing of miRNAs – Strategies, Resources and Methods.
[7] Mechanisms of lncRNA biogenesis as revealed by nascent transcriptomics.
[8] International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome.
[9] Opposing roles for the lncRNA haunt and its genomic locus in regulating HOXA gene activation during embryonic stem cell differentiation.
[10] Beyond the RNA-dependent function of LncRNA genes.
[11] piRNA-Guided Genome Defense: From Biogenesis to Silencing.
[12] A piRNA pathway primed by individual transposons is linked to de novo DNA methylation in mice.
[13] Biological function and clinical application prospect of tsRNAs in digestive system biology and pathology.
[14] The Biogenesis, Functions, and Challenges of Circular RNAs.
[15] Specific expression and functions of circular RNAs.
最后编辑于 2023-12-17 · 浏览 2736