dxy logo
首页丁香园病例库全部版块
搜索
登录

单基因表达数据的提取

发布于 2021-10-17 · 浏览 656 · IP 广东广东
这个帖子发布于 3 年零 197 天前,其中的信息可能已发生改变或有所发展。

大家好,今天我们要讲的是,从我们昨天得到的基因表达矩阵里,提取单基因的表达数据,注意我们下载的数据都是经过校正好的的数据。具体大家可以去看一下,第一节TCGA数据库数据的下载的推文,里面讲的比较详细!生信预热第一谈:如何在TCGA数据库下载你想要的数据?

下面我们来看一下这个基因表达矩阵,注意:如果一个基因出现多行,要对它进行多行取均值的一个操作。


img



所以接下来,我们要做两步:第一步是先对单个基因多行取均值的操作,第二步是把我们需要的基因提取出来,就可以了。这两步的执行需要用到一个脚本文件,这个脚本文件如图所示:


img



这个脚本文件需要用R语言进行运行,所以我们要讲解一下,R语言的安装,如图所示,直接搜索,按照步骤,点击安装就可以了。


img



img


这时,我们还需要准备一个输入文件:symbol.txt,就是我们得到的基因表达矩阵。这个文件在上次推文中的。如图所示:


img


除此之外,脚本运行过程中,还需要一个包:limma包,直接搜索limma biocuductor,点击进入,复制黏贴这三行安装命令到R软件中,就可以进行安装了。如图所示:


img



脚本文件的解析如图所示:


img




img



img


最后是脚本运行,打开脚本,ctrl加a和ctrl加c,复制到R,就可以开始运行脚本了。最后运行得到一个文件。如图所示:

如果大家需要练习的脚本文件,可以在后台留言,我们发给您,如果有什么疑问也可以在后台留言,我们看到的话,会及时回复的。如果觉得本文对你们有用的话,欢迎点赞,关注和分享。谢谢大家。


img

最后编辑于 2022-10-09 · 浏览 656

4 3 2

全部讨论0

默认最新
avatar
4
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部