有关5'UTR、CDS、Exon、Intron、3'UTR的几个概念
蛋白质编码基因至少包含四个组件:TU, MODEL, EXON, CDS
TU代表转录单位,是基因的最高顺式元件。仅在可变剪接体存在时可编码多个基因MODEL
基因MODEL封装了单个剪接异构体所有的的编码和非编码结构,每个基因MODEL可编码剪接数个mRNA EXONS并代表基因剪接后无内含子的部分。
一个mRNA EXON可能仅部分编码蛋白质,恰恰是上游或下游非编码区存在时。每个EXON的蛋白质编码部分由CDS元件表示。CDS元件还编码终止密码子。基因组件不是根据它们的坐标进行排序的。
对于存在非翻译区的区域,将出现UTR。UTR代表了RNA EXON的非蛋白质编码部分。目前,UTRs不支持该DTD以外的TIGR数据类型,它们的存在仅为了便于外部数据分析。
最后编辑于 2022-10-09 · 浏览 10.9 万