【一文就够】查找某一序列范围内所有SNP
虽然我做SNP研究很多年了,但是很少写SNP的分析代码。主要原因是感觉到坛子里研究SNP的战友不多。
只写过一个:【一文就够】批量查询SNP的基因组位置等信息
看到一个求助帖,希望得到:某一序列范围内所有SNP
如果他读懂了我前一个SNP帖子,那么,对于查询的问题,应可一通百通了。但是,,,并没有……
所以,我就再写一个代码贴吧。用R语言运行即可。
```r
# 安装biomaRt包
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("biomaRt", version = "3.8")
# 加载包
library(biomaRt)
# 选择SNP数据库
mart.snp.hs <- useMart(host="http://grch37.ensembl.org",
biomart = "ENSEMBL_MART_SNP",
dataset = "hsapiens_snp")
# 查询基因组区域内的所有snp。
res <- getBM(attributes = c( "refsnp_id","chr_name", "chrom_start", "chrom_end","allele"),
filters = list(chr_name=1,
start=c(222133118),
end=c(222204361)),
mart = mart.snp.hs)
# 结果前6行如下
head(res)
# chr_name chrom_start chrom_end refsnp_id allele
# 1 1 222133118 222133118 rs2790754 T/C
# 2 1 222133119 222133119 rs188023811 A/G
# 3 1 222133122 222133122 rs75899569 T/A
# 4 1 222133123 222133123 rs373516550 C/T
# 5 1 222133142 222133142 rs926715975 T/C
# 6 1 222133143 222133143 rs931440545 C/A
# 保存成excel格式,回头慢慢看。
write.csv(res,"test.csv",quote=F,row.names = F)
```
你可以用excel打开“test.csv”,慢慢看结果咯。
以上。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~
另外,我分享了一个目录:版内《生信问题及解决方案》目录汇总
旨在 完善知识体系、方便查询所需代码、减少搜索的时间;
~~~喜欢我的分享,请用丁当鼓励我吧!~~~~
如你想我发布其他的生信经验分享,可以私信留言给我,
我会不定期挑选一些发布在坛子里
~~~~~~~~~~~~~~~~~~~~~~~~~~~~
















































