【一文就够】批量查询SNP的基因组位置等信息
十年前,GWAS横空出世。SNP成了近十年遗传学研究的宠儿。
十年后,SNP不仅作为疾病标志物,走入大众视野。其生物学功能也逐步被发现。文章不胜枚举。
我们都知道rsID是SNP的身份证。那么,如你手头有多个rsID号,你会如何得到他们的基本信息呢?
今天让我们使用R语言,来快速地认识一下手中SNP的基本信息吧。
```r
# 安装并加载ENSEMBL家的注释包“biomaRt”
source("https://bioconductor.org/biocLite.R")
biocLite("biomaRt")
library(biomaRt)
# 设置基因组位置版本
mart.snp <- useMart(host="http://grch37.ensembl.org", # 这里用b37版本
biomart="ENSEMBL_MART_SNP",
dataset="hsapiens_snp")
# 设置想得到的信息。
getAnno <- function(rs = "rs3043732", mart = mart.snp) {
results <- getBM(attributes =
c( "refsnp_id","chr_name","chrom_start","chrom_end","allele"), # 想得到啥就写在这里吧。
filters = "snp_filter", values = rs, mart = mart)
return(results)
}
# 整两个SNP试试批量化功能
want <- c("rs76347095","rs79636616")
out <- getAnno(want)
# 妥妥得到这俩SNP的信息
# refsnp_id chr_name chrom_start chrom_end allele
#1 rs76347095 2 46589323 46589323 C/A
#2 rs79636616 5 8373495 8373495 T/C
# 保存成excel格式,回头慢慢看。
write.csv(out,"test.csv",quote=F,row.names = F)
```
你可以用excel打开“test.csv”,慢慢看结果咯。
以上。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~
另外,我分享了一个目录:版内《生信问题及解决方案》目录汇总
旨在 完善知识体系、方便查询所需代码、减少搜索的时间;
~~~喜欢我的分享,请用丁当鼓励我吧!~~~~
如你想我发布其他的生信经验分享,可以私信留言给我,
我会不定期挑选一些发布在坛子里
~~~~~~~~~~~~~~~~~~~~~~~~~~~~
最后编辑于 2018-08-09 · 浏览 1.8 万