利用TCGA和文献的思路分析和总结

如今数据库很多,我们该如何分析这些数据呢?
我们需要做的是牢牢捉住你要研究的问题,比如说我要研究某个基因的表达,我们首先要知道这个基因的表达流程:我们主要是按照中心法则来进行分析和讲解的:首先基因转录至mRNA,然后翻译为蛋白质,而TCGA数据库测的是基因转录成的mRNA的表达数据,当然基因还会转录成lcRNA等其它的RNA等,但是只有MRNA会翻译为蛋白质,而在翻译为蛋白质的过程中,需要很多的其他类型的RNA和蛋白质的协助,才能表达为蛋白质。
所以我们测完MRNA的表达量,最理想的还是要测一下蛋白质的表达量,这时候对蛋白质的定量表达分析,我们需要用到最经典的免疫组化试验了。如果大家对免疫组化不熟悉的话,可以去看一下我们公众号以前推过的免疫组化的推文了,里面讲的很详细,包括了常见的免疫组化过程中可能会出现的问题。步骤和原理也讲得很不错,这里附上一个链接,必看:免疫组化操作流程!方便大家观看。

好了接下来,我们回到正题:如果我们要确定一个基因是否表达了,我们可以先通过TCGA数据库,测出该基因的MRNA的表达量,然后再通过定量的方式测出其蛋白表达量,如果结果呈正相关。说明该基因的表达增加了,这时候我们需要一个对照,我以在肿瘤组织和在正常组织中某基因表达的高低来举例说明:如果要验证某基因在肿瘤组织中高表达,就必须以其在正常组织中表达作为对照,或是其他对照组。然后我们要检验一下,在患某种癌症中的病人中是否都是高表达,这时就需要我们用到统计学的知识,在这里我放上以前推文中关于某基因在正常人和患肿瘤患者中的表达的检验的推文。某基因在正常人组织和肿瘤组织中的差异性表达大家可以去看一下。
好了接下来我们继续:检验了某基因在肿瘤组织假设是高表达。这时候,你需要查证相关文献来证明你的观点。因为单单证明它的MRNA高表达没有什么意义,必须证明他表达的蛋白质也是高表达。恭喜你坚持看到了这里,下面还是满满的干货,关于课题分析的哦。接下来我们要去查这个基因的生物学意义,比如这个基因参与到了哪一条通路,从而介导了什么样的生物学的行为,比如介导了肿瘤的转移,如果这样比较陌生,换句话说就是在肿瘤的转移中,这条通路对肿瘤的转移很重要,所以如果某个基因在某条通路里很重要,那么就可以说是它介导了某种生物学行为。
这里比较难理解哦,大家可以好好去理解一下,所以接下来就需要去验证通路相关的基因表达了。方法还是同上。做完这一步后,可能需要花费很多的时间了。可能花了很多时间也没做出来。这时候,你不必灰心,先好好总结一下,这才是最重要的!好了,今天也讲了这么多了,大家可以先去尝试一下,在这个过程中,可能会出现很多问题,比如说TCGA数据库怎么下载数据进行表达分析,具体的操作可以去看我前面的推文,里面讲的比较详细,在这里我先附上一个链接。生信预热第一谈:如何在TCGA数据库下载你想要的数据?如果需要脚本和代码的话可以在公众号后台私信留言哦。
还有其他的许多的问题,比如说文献的检索等等,大家可以参考一下我以前发过的推文哦。在这里附上链接哦。等等。
好了,总结一下,要想科研做的好,第一步就是做好规划,一步一步的来。 最后是打广告的时间了,我们是科研风雨路,如果您觉得我们发布的知识对您有用的话,请您点一下关注,收藏和在看哦。

最后编辑于 2022-10-09 · 浏览 1017