求助!基因测序结果分析及下一步实验重点(50丁当)
各位老师好,目前刚接手课题组高度近视基因测序的课题,课题进度是目前已经送检了50个病例组(散发居多),17个对照组的外周血进行DNA测序,筛查的基因有1236个,都是眼科疾病相关的基因,然后测序的结果拿到了,面临的问题是:1. 本人在这一块完全空白,而之前这个课题相当于被遗弃的状态,师兄师姐对这一块也不熟,不知道如何分析和往下做;2.检测的公司因为种种原因无法很好的沟通,所以很多测序的方法结果细节都不是很清楚;所以不得不来这里求助。
送检的标本是病例组71例,而对照组是17例,拿到的结果有1.EXCEL表,这个表中包含病例组的结果和一小部分对照组,截图如下,为了保护内部信息,我在附件1中只提供了部分病人的数据(请谅解),2. 后面公司又将病例组和对照组的结果比对后给了我们p值有意义的15个基因,见附件2。
然后我的想法和疑问就是如何分析现有的结果以及下一步要怎么把这个课题做下去;具体到1. 这样的方法可不可行? 从已经报道过的眼科疾病基因中找高度近视的致病基因,或者是看已经报道的高近基因在这个人群中是否发生突变;2.样本量是否太少,我看文献上的样本量都是上百的,几百的,最起码我觉得对照组17个是说不过去的;这样得到的附件2的结果应该是不足为信的; 但是如果方法不可行的话,从及时止损的角度说,我可能就不再继续在那边检测了;如果不继续测的话,我可不可以拿数据库正常人的数据直接比对呢;3. 我尝试分析已经拿到的附件,大神看下我的思路有没有毛病1,首先根据数据库把表格里MAF小于0.01的基因剔除;2. 把CLINSIG为benign的基因剔除;3. 把SIFT里为tolerated的基因剔除 4. 比较病例组和对照组的基因频率,但是对照组太少了,此时可以先跟数据库的比较,再增加对照组的样本量吗?对于这个表还能做哪些分析呢?
问题又长又臭,在此谢过各位大神,任何一点有建议都麻烦赐教,谢谢!