• 论坛首页
  • 我的丁香客
  • 找人
    查找好友
  • 更多
    丁香园
    丁香通
    丁香人才
    丁香会议
    丁香搜索
    丁香医生
    丁香无线
    丁香导航
    丁当铺
    文献求助
    医药数据库
    丁香诊所
    来问医生
登录 注册

生物信息

关注今日:4 | 主题:140340
论坛首页  >  生物信息学讨论版   >  NGS & Microarray
  • 发帖
    每发1个新帖
    可以获得0.5个丁当奖励
  • 回帖

分享到:

  • 微信

    微信扫一扫

  • 微博
  • 丁香客
  • 复制网址

求助哪位大神知道全外显子测序的流程和原理?

  • 只看楼主
  • 页码直达:
  • 直达末页
楼主 sunny0596
sunny0596
常驻站友

  • 1
    积分
  • 31
    得票
  • 2
    丁当
  • 1楼
这个帖子发布于4年零261天前,其中的信息可能已发生改变或有所发展。

求助哪位大神知道全外显子测序的流程和原理呀,看了文献中的过程,有部分内容不是特别理解,问题可能比较多,求大神路过指教啊。

Whole exome sequencing on the proband and both her parents was performed by Perkin Elmer using the  llumina Hiseq 2000 machine for 100 bp Paired end sequencing (Instrument control software 1.4.8; RTA  ersion 1.12.4.2). 

1. "100 bp Paired end sequencing"怎么理解呢?


Following targeted enrichment using the SureSelect (Agilent Technologies Canada Inc.) 50Mb v3 Capture kit, we obtained a yield of 20‐22 Gb of sequence data (~84.000.000 reads) per individual. 

2. “Following targeted enrichment” 目标富集是什么意思呢?


The mean exome coverage was 89 fold, with at least 80% of the exome covered more than 30 times. 

3. “fold”是什么意思呢,“at least 80% of the exome covered more than 30 times” 覆盖了至少30倍,这个有什么意义呢?


Mapping to the reference genome sequence (hg19) and alignment was done using both Bowtie and BWA algorithms in order to effectively align reads with substitutions as well as short indels.  The –m 1 option specifies bowtie to discard any reads that can be mapped to more than one location. 

4. “discard any reads that can be mapped to more than one location” 为什么要弃掉map超过一个位点的read呢?不懂原因……


Using samtools, sam.files were then converted to bam.files removing unaligned reads as well as alignments with a quality lower than a Phred quality score at 20 for the entire read.  For local realignment we used the GATK aligner, which searches for missing deletions in Bowtie+BWA  rocedure to reduce false positives. Variant calling was performed by using samtools mpileup.

5.有没有大神大概讲下samtools,GATK aligner给扫下盲?


Single  ucleotide  variants were filtered for minimum mapping quality of a Phred quality score at 30 allowing 99.9% base call accuracy.

6. “a Phred quality score”是什么意思呢?


We deleted non-exonic variants and variants indicated as synonymous to obtain 10.000-15.000 rare (< 0.01 minor allele frequency) or novel variants for each individual. 

7."deleted non-exonic variants"不是全外显子测序吗,为什么还会有非外显子的序列呢?


(Filges I, Manokhina I, Penaherrera M S, et al. Recurrent triploidy due to a failure to complete maternal meiosis II: whole-exome sequencing reveals candidate variants[J]. Mol Hum Reprod,2015,21(4):339-346.)

  • 邀请讨论
  • 不知道邀请谁?试试他们

    换一换
2016-06-11 14:54 浏览 : 23744 回复 : 10
  • 投票 2
  • 收藏 29
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 上海市2021年2月CPC病例讨论(已揭秘)
微笑37度
微笑37度
常驻站友

  • 1
    积分
  • 21
    得票
  • 15
    丁当
  • +1 积分
  • 2楼

1.“100 bp Paired end sequencing”应该指100bp的大小的DNA序列,因为在基因组建文库前需要超声打断成15小的片段,然后进行建库的后续工作。

2.Following targeted enrichment是指接下来进行目标序列捕获,因为刚开始你得到的是整个基因组的文库,而你的目标是外显子文库,the SureSelect (Agilent Technologies Canada Inc.) 50Mb v3 Capture kit是全外显子捕获试剂盒,就是通过特有的引物序列与目的DNA片段进行杂交,纯化后通过LM-PCR进行富集可以得到一定产量的全外文库。

3.fold是指"×",The mean exome coverage was 89 fold应该是说平均的测序深度是89×,测序深度是指

指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M,测序深度为10X,那么获得的总数据量为20M,所以应该是指获得的数据量,这方面我也不是很懂,呵呵

下面几个问题应该是数据分析方面的,我也是菜鸟,不是很懂。。。。会继续关注答案的


2016-06-11 17:43
  • 投票 6
  • 收藏 3
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 我到底要不要读这个博士?
happy6
happy6
铁杆站友

  • 17
    积分
  • 68
    得票
  • 540
    丁当
  • +1 积分
  • 3楼

楼主后面的几个问题都不是简单的文字可以解释给你的,建议楼主和市面上的一些测序公司接触一下,前期可以和销售沟通,等楼主对测序的一些基本知识了解之后,再跟技术支持去沟通一下,当然对于一些生物信息分析方面的内容要和生物信息分析人员沟通才行。所以,你要是想弄明白以上你问的几个问题,单纯的通过发这个帖子肯定是不太现实的,最好的办法就是多跟懂这些知识的人沟通才好。祝好运。

2016-06-13 14:35
  • 投票 3
  • 收藏
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 2021年基层医疗机构绩效考核变了,事关医生的钱袋子,速看!
水行船
水行船
常驻站友

  • 3
    积分
  • 31
    得票
  • 102
    丁当
  • +1 积分
  • 4楼

你要的应该是二代测序的流程:

DNA提取-打断-连接头-建库-质检-上机(簇生长-便合成边测序)-数据收集-拼接-后期分析。

2016-06-13 17:35
  • 投票 3
  • 收藏 1
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 烂进膝关节的痛风石,都是年轻时大量喝啤酒惹的祸

关闭提示

需要2个丁当

丁香园旗下网站

  • 丁香园
  • 用药助手
  • 丁香通
  • 文献求助
  • 丁香人才
  • 丁香医生
  • 丁香导航
  • 丁香会议
  • 手机丁香园
  • 医药数据库

关于丁香园

  • 关于我们
  • 丁香园标志
  • 友情链接
  • 联系我们
  • 加盟丁香园
  • 版权声明
  • 资格证书

官方链接

  • 丁香志
  • 丁香园新浪微博
引用回复