单基因表达数据的提取
大家好,今天我们要讲的是,从我们昨天得到的基因表达矩阵里,提取单基因的表达数据,注意我们下载的数据都是经过校正好的的数据。具体大家可以去看一下,第一节TCGA数据库数据的下载的推文,里面讲的比较详细!生信预热第一谈:如何在TCGA数据库下载你想要的数据?
下面我们来看一下这个基因表达矩阵,注意:如果一个基因出现多行,要对它进行多行取均值的一个操作。

所以接下来,我们要做两步:第一步是先对单个基因多行取均值的操作,第二步是把我们需要的基因提取出来,就可以了。这两步的执行需要用到一个脚本文件,这个脚本文件如图所示:

这个脚本文件需要用R语言进行运行,所以我们要讲解一下,R语言的安装,如图所示,直接搜索,按照步骤,点击安装就可以了。


这时,我们还需要准备一个输入文件:symbol.txt,就是我们得到的基因表达矩阵。这个文件在上次推文中的。如图所示:

除此之外,脚本运行过程中,还需要一个包:limma包,直接搜索limma biocuductor,点击进入,复制黏贴这三行安装命令到R软件中,就可以进行安装了。如图所示:

脚本文件的解析如图所示:



最后是脚本运行,打开脚本,ctrl加a和ctrl加c,复制到R,就可以开始运行脚本了。最后运行得到一个文件。如图所示:
如果大家需要练习的脚本文件,可以在后台留言,我们发给您,如果有什么疑问也可以在后台留言,我们看到的话,会及时回复的。如果觉得本文对你们有用的话,欢迎点赞,关注和分享。谢谢大家。

最后编辑于 2022-10-09 · 浏览 656