关于SNP,你需要了解的
SNP如何影响蛋白结构与功能?上世纪50年,”中心法则“阐明DNA的改变会导致RNA变化,并最终可能导致编码氨基酸的变化。而氨基酸改变(蛋白质一级结构)可能会导致蛋白质高级结构改变并最终影响蛋白质的功能。最经典的例子就是镰刀型贫血病
病人的血红蛋白b亚基N端第146个氨基酸由极性的谷氨酸(glu)突变成非极性的缬氨酸(val),val上的非极性基团与相邻非极性基团在疏水作用力下相互靠拢,血红蛋白形成纤维沉淀,压迫细胞膜,使红细胞弯曲成镰刀状。红细胞有可能因此破裂,发生溶血。
这一变化的根本原因仅仅是DNA链上一个核苷酸的改变:T突变成了A。
今天就先给大家讲SIFT软件:SIFT(Sorting Intolerant From Tolerant)网址:http://sift.jcvi.org/
它是基于蛋白序列同源性算法的预测原理(sequence homology-based tool),来预测氨基酸替换的影响。预测结果中,对于由核苷酸突变引起的氨基酸替换的预测结果被计算成一个标准化分值(score),变化范围从0到1。评级有4个标准:tolerated low confidencetolerateddeleterious low confidencedeleterious当SNP的score>0.5,说明这个突变是可以容忍的(tolerated),及该SNP对蛋白质功能是没有影响或影响很小;当SNP的score<0.5,说明这个突变是有害的(deleterious),即该SNP对蛋白质功能有较大影响。一个SNP的得分越低,危害性越大。SIFT使用方法:进入网站后,输入SNP的id号或者蛋白质序列,然后点击“提交”

Polyphen2和SIFT网站上都提供了源数据库的下载,下载到本地后,再写个小程序,将call出的SNP和源数据库进行比对,就可以筛选出来。
现在以上的这些操作只需要在GCBI上花费不到1分钟就可以完成
以下是在GCBI上完成的基因组测序数据与参考基因组比对,得到了392万个SNP。
















































