dxy logo
首页丁香园病例库全部版块
搜索
登录

【一文就够】查找某一序列范围内所有SNP

医疗行业从业者 · 发布于 2019-01-08 · IP 北京北京
5365 浏览
这个帖子发布于 6 年零 304 天前,其中的信息可能已发生改变或有所发展。

虽然我做SNP研究很多年了,但是很少写SNP的分析代码。主要原因是感觉到坛子里研究SNP的战友不多。

只写过一个:【一文就够】批量查询SNP的基因组位置等信息

看到一个求助帖,希望得到:某一序列范围内所有SNP

如果他读懂了我前一个SNP帖子,那么,对于查询的问题,应可一通百通了。但是,,,并没有……


所以,我就再写一个代码贴吧。用R语言运行即可。


```r

# 安装biomaRt包

if (!requireNamespace("BiocManager", quietly = TRUE))

  install.packages("BiocManager")

BiocManager::install("biomaRt", version = "3.8")

# 加载包

library(biomaRt)

# 选择SNP数据库

mart.snp.hs <- useMart(host="http://grch37.ensembl.org",

                        biomart = "ENSEMBL_MART_SNP",

                        dataset = "hsapiens_snp")

# 查询基因组区域内的所有snp。

res <- getBM(attributes = c( "refsnp_id","chr_name", "chrom_start", "chrom_end","allele"),

                       filters = list(chr_name=1,

                                          start=c(222133118),

                                          end=c(222204361)),

                        mart = mart.snp.hs)

# 结果前6行如下

head(res)

#  chr_name chrom_start chrom_end   refsnp_id allele

# 1        1   222133118 222133118   rs2790754    T/C

# 2        1   222133119 222133119 rs188023811    A/G

# 3        1   222133122 222133122  rs75899569    T/A

# 4        1   222133123 222133123 rs373516550    C/T

# 5        1   222133142 222133142 rs926715975    T/C

# 6        1   222133143 222133143 rs931440545    C/A

# 保存成excel格式,回头慢慢看。

write.csv(res,"test.csv",quote=F,row.names = F)

```


你可以用excel打开“test.csv”,慢慢看结果咯。

以上。


~~~~~~~~~~~~~~~~~~~~~~~~~~~~

另外,我分享了一个目录:版内《生信问题及解决方案》目录汇总

旨在 完善知识体系、方便查询所需代码、减少搜索的时间;

~~~喜欢我的分享,请用丁当鼓励我吧!~~~~

如你想我发布其他的生信经验分享,可以私信留言给我,

我会不定期挑选一些发布在坛子里

~~~~~~~~~~~~~~~~~~~~~~~~~~~~


3 13 4

全部讨论(0)

默认最新
avatar
3
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部