dxy logo
首页丁香园病例库全部版块
搜索
登录

【一文就够】批量查询SNP的基因组位置等信息

发布于 2018-08-09 · 浏览 1.8 万 · IP 北京北京
这个帖子发布于 6 年零 270 天前,其中的信息可能已发生改变或有所发展。

十年前,GWAS横空出世。SNP成了近十年遗传学研究的宠儿。


十年后,SNP不仅作为疾病标志物,走入大众视野。其生物学功能也逐步被发现。文章不胜枚举。


我们都知道rsID是SNP的身份证。那么,如你手头有多个rsID号,你会如何得到他们的基本信息呢?


今天让我们使用R语言,来快速地认识一下手中SNP的基本信息吧。


```r

# 安装并加载ENSEMBL家的注释包“biomaRt”

source("https://bioconductor.org/biocLite.R")

biocLite("biomaRt")

library(biomaRt)

# 设置基因组位置版本

mart.snp <- useMart(host="http://grch37.ensembl.org",  # 这里用b37版本

                    biomart="ENSEMBL_MART_SNP",

                    dataset="hsapiens_snp")

# 设置想得到的信息。

getAnno <- function(rs = "rs3043732", mart = mart.snp) {

  results <- getBM(attributes = 

                    c( "refsnp_id","chr_name","chrom_start","chrom_end","allele"),  # 想得到啥就写在这里吧。

                   filters    = "snp_filter", values = rs, mart = mart)

  return(results)

}

# 整两个SNP试试批量化功能

want <- c("rs76347095","rs79636616")

out <- getAnno(want)

# 妥妥得到这俩SNP的信息

#     refsnp_id chr_name chrom_start chrom_end allele

#1  rs76347095        2    46589323  46589323    C/A

#2  rs79636616        5     8373495   8373495    T/C


# 保存成excel格式,回头慢慢看。

write.csv(out,"test.csv",quote=F,row.names = F)

```


你可以用excel打开“test.csv”,慢慢看结果咯。

以上。


~~~~~~~~~~~~~~~~~~~~~~~~~~~~

另外,我分享了一个目录:版内《生信问题及解决方案》目录汇总

旨在 完善知识体系、方便查询所需代码、减少搜索的时间

~~~喜欢我的分享,请用丁当鼓励我吧!~~~~

如你想我发布其他的生信经验分享,可以私信留言给我,

我会不定期挑选一些发布在坛子里

~~~~~~~~~~~~~~~~~~~~~~~~~~~~


最后编辑于 2018-08-09 · 浏览 1.8 万

19 80 8

全部讨论0

默认最新
avatar
19
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部