dxy logo
首页丁香园病例库全部版块
搜索
登录

GSEA需要的GMT文件如何制作呢

发布于 2019-09-10 · 浏览 7400 · IP 山西山西
这个帖子发布于 5 年零 243 天前,其中的信息可能已发生改变或有所发展。

芯片数据想要做GSEA,前期的输入基本没问题,可以正常运行,但目前的问题就是我的芯片是大鼠的,而我选择的是c2.cp.kegg.v7.0.symbols.gmt这个数据库,我们知道这个数据库对应的是人的,所以虽然可以出来正常的结果,但是还是考虑到人和大鼠物种之间的差异影响,我想使用大鼠的数据库再试试。

麻烦问一下万能的园友,我如何制作属于大鼠的GMT,再哪里下载呢?

如下是我搜到的制作GMT的信息:

gmt格式是多列注释文件,第一列是基因所属基因集的名字,可以是通路名字,也可以是自己定义的任何名字。第二列,官方提供的格式是URL,可以是任意字符串。后面是基因集内基因的名字,有几个写几列。列与列之间都是TAB分割。

Pathway_description    Anystring    Gene1    Gene2    Gene3 

Pathway_description2    Anystring    Gene4    Gene2    Gene3    Gene5

GSEA官网只提供了人类的数据,但是掌握了官网中基因表达矩阵和注释文件的数据格式,就可以根据自己研究的物种,在公共数据库下载对应物种的注释数据,自己制作格式一致的功能基因集文件,这样便就可以做各种物种的GSEA富集分析了。(如何再公共数据库下载对应物种的注释数据呢)

img


最后编辑于 2022-10-09 · 浏览 7400

5 2 1

全部讨论0

默认最新
avatar
5
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部