【一文就够】根据基因名批量下载蛋白质序列
使用R语言的biomart包,可以完成这个任务。
```r
# 安装biomaRt包
source("http://bioconductor.org/biocLite.R")
biocLite("biomaRt")
# 加载biomaRt包
library(biomaRt)
# 定义数据库
mart <- useMart("ensembl", dataset="hsapiens_gene_ensembl")
# 根据基因名,批量提取蛋白质序列
seq = getSequence(id = c("BRCA1","TP53"),
type = "hgnc_symbol",
seqType = "peptide",
mart = mart)
# 显示基因名和蛋白质序列
show(seq)
# 默认目录下输出fasta格式seq
exportFASTA(seq, file="seq")
```
# 致谢
感谢@火车二场 ,提供了【输出fasta格式】的代码。
拟解决论坛内问题:
~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~喜欢我的分享,请用丁当鼓励我吧!~~~~
如你想我发布其他的生信经验分享,可以私信留言给我,
我会不定期挑选一些发布在坛子里
~~~~~~~~~~~~~~~~~~~~~~~~~~~~
我发布在坛子里的、可能值得你一读的其他文章:
最后编辑于 2018-07-25 · 浏览 1.2 万