dxy logo
首页丁香园病例库全部版块
搜索
登录

【一文就够】根据基因名批量下载蛋白质序列

发布于 2018-05-12 · 浏览 1.2 万 · IP 北京北京
这个帖子发布于 6 年零 359 天前,其中的信息可能已发生改变或有所发展。


使用R语言的biomart包,可以完成这个任务。


```r

# 安装biomaRt包

source("http://bioconductor.org/biocLite.R")

biocLite("biomaRt")

# 加载biomaRt包

library(biomaRt)

# 定义数据库

mart <- useMart("ensembl", dataset="hsapiens_gene_ensembl")

# 根据基因名,批量提取蛋白质序列

seq = getSequence(id = c("BRCA1","TP53"), 

                  type = "hgnc_symbol", 

                  seqType = "peptide", 

                  mart = mart)

# 显示基因名和蛋白质序列

show(seq)

# 默认目录下输出fasta格式seq

exportFASTA(seq, file="seq")

```


# 致谢

感谢@火车二场 ,提供了【输出fasta格式】的代码。


拟解决论坛内问题:

怎么根据基因名或者ID,批量得到蛋白序列

如何批量下载不同物种的某基因序列

用bioperl从NCBI批量下载序列

如何批量获取基因的氨基酸序列


~~~~~~~~~~~~~~~~~~~~~~~~~~~~

~~~喜欢我的分享,请用丁当鼓励我吧!~~~~

如你想我发布其他的生信经验分享,可以私信留言给我,

我会不定期挑选一些发布在坛子里

~~~~~~~~~~~~~~~~~~~~~~~~~~~~


我发布在坛子里的、可能值得你一读的其他文章:

TCGA-mRNA数据下载

TCGA数据ENSG转换为基因名(Symbol)

根据基因名批量下载蛋白质序列

批量下载SNP附近序列


最后编辑于 2018-07-25 · 浏览 1.2 万

3 36 9

全部讨论0

默认最新
avatar
3
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部