Ensemble查询基因页面关键词释义-你知道多少?

(图1 ensemble基因查询页面提醒关键词)
第一部分:基因序列的功能区域
这些术语描述了一个基因的DNA序列中不同功能的部分。
Translated sequence--翻译序列
解释:指DNA序列中最终会被核糖体翻译成蛋白质氨基酸序列的那一部分。它等同于“编码序列”。
Coding sequenc--编码序列
解释:基因中直接指定蛋白质氨基酸序列的核苷酸序列。它从起始密码子开始,到终止密码子结束。CDS不包括内含子。
UTR--非翻译区
解释:信使RNA中不被翻译成蛋白质的部分,但对基因表达调控至关重要(如mRNA的稳定性、定位和翻译效率)。它分为两个部分:
5‘ prime UTR:位于编码序列的上游,起始密码子之前。它包含核糖体结合位点等重要调控元件。
3' prime UTR:位于编码序列的下游,终止密码子之后。它通常包含影响mRNA稳定性和定位的序列,以及多聚腺苷酸尾巴的添加信号。
Intron sequence--内含子序列
解释:基因中在转录后会被剪切掉,不参与最终蛋白质编码的部分。它们存在于DNA和初始RNA转录本中,但在成熟的mRNA中被移除。
Flanking sequence--侧翼序列
解释:指位于您所关注的特定区域(例如一个外显子、一个变异位点)两侧的DNA序列。在分析中,它通常作为参照序列,用于确定变异发生的精确位置和环境。
第二部分:基因变异的类型和效应
这些术语描述了DNA序列发生的变化(变异)及其对蛋白质功能可能产生的影响。
Frameshift--移码突变
解释:由于插入或缺失了非3的倍数个核苷酸,导致其后的所有密码子阅读框架发生移动。这通常会产生一个完全错误的氨基酸序列,并常常导致提前出现终止密码子,产生截短蛋白,破坏性极大。
Inframe deletion / Inframe insertion--框内缺失/框内插入
解释:指在编码序列中插入或缺失了正好是3的倍数个核苷酸。这不会改变阅读框,但会在蛋白质中导致一个或多个氨基酸的缺失或增加,而不是打乱整个后续序列。
Missense--错义突变
解释:单个核苷酸的改变导致一个密码子变成另一个密码子,从而使编码的一种氨基酸变为另一种氨基酸。这种改变可能影响蛋白质的结构和功能,影响程度取决于具体的氨基酸变化。
Synonymous--同义突变
解释:单个核苷酸的改变虽然改变了密码子,但没有改变所编码的氨基酸(由于遗传密码的简并性)。传统上认为它不影响蛋白质功能,但可能影响mRNA剪接或稳定性。
Nonsense--无义突变
解释:单个核苷酸的改变导致一个编码氨基酸的密码子变成了一个终止密码子。这会使蛋白质合成提前终止,产生一个截短的、通常没有功能的蛋白质。
Stop gained--获得终止密码子
解释:这个术语与“无义突变”意思完全相同。
Stop lost--终止密码子丢失
解释:变异发生在天然的终止密码子上,使其变成了一个编码氨基酸的密码子。这会导致翻译不在正常位置停止,使蛋白质的C端异常延长。
Start lost--起始密码子丢失
解释:变异发生在起始密码子上,使其无法被核糖体正常识别。这可能导致翻译从另一个(通常是不正确的)起始点开始,或者完全不翻译。
Splice region--剪接区域变异
解释:变异发生在内含子-外显子边界附近负责mRNA剪接的保守序列区域(如供体、受体位点)。这种变异可能破坏正常的剪接过程,导致外显子被跳过或内含子被保留。
Protein altering variant--蛋白质改变性变异
解释:这是一个总称,泛指任何会导致最终蛋白质的氨基酸序列发生改变的变异。它包括错义、无义、移码、框内插入/缺失等多种类型。
Stop retained--终止密码子保留
解释:这是一个相对少见的术语。通常指一个同义变异恰好发生在终止密码子上。例如,UAA变为UAG,两者都是终止密码子,所以功能没有改变。
表1 Ensemble基因查询页面关键词注解
