GSEA需要的GMT文件如何制作呢
芯片数据想要做GSEA,前期的输入基本没问题,可以正常运行,但目前的问题就是我的芯片是大鼠的,而我选择的是c2.cp.kegg.v7.0.symbols.gmt这个数据库,我们知道这个数据库对应的是人的,所以虽然可以出来正常的结果,但是还是考虑到人和大鼠物种之间的差异影响,我想使用大鼠的数据库再试试。
麻烦问一下万能的园友,我如何制作属于大鼠的GMT,再哪里下载呢?
如下是我搜到的制作GMT的信息:
gmt格式是多列注释文件,第一列是基因所属基因集的名字,可以是通路名字,也可以是自己定义的任何名字。第二列,官方提供的格式是URL,可以是任意字符串。后面是基因集内基因的名字,有几个写几列。列与列之间都是TAB分割。
Pathway_description Anystring Gene1 Gene2 Gene3
Pathway_description2 Anystring Gene4 Gene2 Gene3 Gene5
GSEA官网只提供了人类的数据,但是掌握了官网中基因表达矩阵和注释文件的数据格式,就可以根据自己研究的物种,在公共数据库下载对应物种的注释数据,自己制作格式一致的功能基因集文件,这样便就可以做各种物种的GSEA富集分析了。(如何再公共数据库下载对应物种的注释数据呢)
最后编辑于 2022-10-09 · 浏览 7400