利用NCBI寻找基因的CDS区
最近本人也在学习寻找基因的CDS区,感觉教的都不是很全,以内参基因GAPDH为例,先手把手教学。
首先介绍:CDS(Sequence coding for aminoacids in protein)蛋白质编码区,CDS是Coding sequence的缩写,是编码蛋白产物的序列,是结构基因组学术语。
1、登录NCBI网站,https://www.ncbi.nlm.nih.gov/pmc/ ,输入GAPDH,Gene,搜索:
2、选择合适物种,以human为例,点击进入:
3、在出现的界面的右边有个目录(table of contents),点击NCBI reference sequences,
4、我们发现GAPDHA有5个转录本,即在mRNA and protein(s)下编号1-5:
5、选择转录本1,点击NM_001256799.2 ,进入下一步:
6、下拉网页,出现CDS,即可,点击CDS:
7、弹出序列的棕色部分,即为GAPDH的CDS:
8、同样方法我们可以寻找不同转录本的CDS,exon,STS序列。
欢迎大家一起讨论学习。。。