• 论坛首页
  • 我的丁香客
  • 精品栏目
    微话题
    微访谈
    病例挑战
  • 找人
    查找好友
    认证专家
    专家主页
    机构主页
    可能感兴趣
  • 随便看看
  • 更多
    丁香园
    丁香通
    丁香人才
    丁香会议
    丁香搜索
    丁香医生
    丁香无线
    丁香导航
    丁当铺
    文献求助
    医药数据库
    丁香诊所
    来问医生
登录 注册

生物信息

关注今日:28 | 主题:123116
论坛首页  >  生物信息学讨论版   >  生物_信息结合
  • 发帖
    每发1个新帖
    可以获得0.5个丁当奖励
  • 回帖

分享到:

  • 微信

    微信扫一扫

  • 微博
  • 丁香客
  • 复制网址

手把手教你如何使用GSEA

  • 只看楼主
  • 页码直达:
  • 直达末页
楼主 康小杨
康小杨
科室保密
丁香园准中级站友

  • 63
    积分
  • 325
    得票
  • 549
    丁当
  • +2 积分
  • 1楼

最近学习GSEA,在学习过程中搜索园子里关于GSEA的帖子,似乎不多,也不太全,特来发帖,以助后来小伙伴少走弯路~

1.     进入官网下载GSEA,很多人下载桌面板,但是我觉得java更小更方便啦,看个人喜好喽。

http://software.broadinstitute.org/gsea/downloads.jsp

2.     下载java 8.,某度上有很多经验,https://jingyan.baidu.com/article/456c463b53794d0a5831442b.html

下载完成后,在dose里运行java –version,显示如下,即安装好。


3.         把下载的GSEA拖到自己的文件中,我放在G盘了,运行java -jar gsea-3.0.jar,界面就出来啦。


正式开始做GSEA喽~

4.     准备文件。

一定要看清我文件后缀!!!一定要看清我文件后缀!!!一定要看清我文件后缀!!!重要的事情说三遍!!!


a. 第一个文件在官网网站下载,也可不下。

b. 第二个文件是差异分析的基因,格式如下。

#1.2照写

19668是分析的差异基因总数,611是样本总数

Description是对gene的描述,因为有的童鞋拿回来的gene是探针名,这时候就可以在第二列写你的gene symbol,我因为去掉了探针名,所以就写的NA喽,GSEA格式就是这么要求的,不要问为什么~


c. 第三个文件格式如下:


611是样本数,2是分组,1是啥我也不知道,嘿嘿。

第2行是组名,我做的肿瘤就分为normal和tumor,可以自行更换。

第三行是样本名,每一个样本在什么组,有多少就写多少,我写了611个。

5.     进入GSEA。


将文件全部导入,有错误这一步就会报错,根据提示修改即可。

6.     点击Run GSEA.


第一个选项是基因表达矩阵文件。

第二个就是官网下载的文件,这里看个人喜好,可以做KEGG,GO什么的,也可以在这里下载其他的功能注释数据库。


第三个就是自己选了,normal可在前在后。


7.     探针转换基因名,我自带名称,选择的否。


如果选择True,下面的platform就要选一个注释的数据库,一般好像选第一个好像,我没试过,小伙伴们可以多尝试几个数据库。

8.     点击

等结果。

 


9.     结果所在的目录。

万事大吉。

请小伙伴不要吝啬你的票,嘿嘿~


  • 邀请讨论
  • 不知道邀请谁?试试他们

    换一换
2018-02-10 11:43 浏览 : 21920 回复 : 42
  • 投票 58
  • 收藏 132
  • 打赏 12
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
康小杨 编辑于 2018-02-21 09:34
  • • 2019考研调剂院校汇总(持续更新)

收起全部有料回复

火车二场
火车二场
铁杆站友

  • 47
    积分
  • 205
    得票
  • 540
    丁当
  • +1 积分
  • 热
  • 10楼
elliott1023

楼主,你好,我求助一下这个是什么原因?是否可以改变阈值在试试?

可以试下改变阈值,但很大可能是不管用的。

最有可能的原因是你的gmt文件的gene 名称与gct文件的gene名称不匹配造成的,比如大小写不一致(常见于gmt为人的gene set,而gct是其它物种芯片注释)。

两个解决办法是:

(1)采用与你数据的物种来源一致的gene sets,即gmt文件。比如你的数据是鼠的数据,直接用MSigDB的数据是不行的,需要自己将其基因名称转换为鼠的。(collapse dataset to gene symbols 设置要为false)

(2)将你数据的gene名称转换成与gene sets一致。简单一点,比如,若你的gmt文件用的是MSigDB,可将你gct文件中的第一列设置为芯片探针名称,run的时候将collapse dataset to gene symbols 设置为ture,chip platform 选择为你的芯片,让软件自动为你转换。

供参考。

2018-03-23 08:51
  • 投票 6
  • 收藏 6
  • 打赏 2
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 丁香早知道-2.14 | 年后的医院有多忙?一天800个CT,就问还有谁?
tzjz_zrz
tzjz_zrz
常驻站友

  • 3
    积分
  • 58
    得票
  • 4282
    丁当
  • 2楼

谢谢,挺好用的。

2018-02-21 03:25
  • 投票
  • 收藏
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • B区调剂学校分享
黄宁123
黄宁123
铁杆站友

  • 11
    积分
  • 1269
    得票
  • 4
    丁当
  • 3楼

只收藏不点赞吗?谢谢楼主~

2018-02-22 14:01
  • 投票 1
  • 收藏 1
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 检验精液涂片G-球菌,培养确是缓症链球菌

关闭提示

需要2个丁当

丁香园旗下网站

  • 丁香园
  • 用药助手
  • 丁香通
  • 文献求助
  • 丁香人才
  • 丁香医生
  • 丁香导航
  • 丁香会议
  • 手机丁香园
  • 医药数据库

关于丁香园

  • 关于我们
  • 丁香园标志
  • 友情链接
  • 联系我们
  • 加盟丁香园
  • 版权声明
  • 资格证书

官方链接

  • 丁香志
  • 丁香园新浪微博
Copyright © 2000-2019 DXY All Rights Reserved.
浙B2-20070219(含BBS) | (浙)-经营性-2017-0006 | 浙公网备案 33010802004314 号 | 出版物经营许可证:新出发滨字第0064号
网络文化经营许可证:浙网文 [2018]11330-875 号 | 食品许可证:JY13301080010985 号 | 人力资源许可证:330101000525 号
第二类医疗器械经营备案凭证:浙杭食药监械经营备 20153170 号 | 医疗器械网络销售备案表: (浙杭)网械企备字[2018]第 00246 号

用户应遵守著作权法,尊重著作权人合法权益,不违法上传、存储并分享他人作品。投诉、举报、维权邮箱:lawyer@dxy.cn

Web版 | 触屏版
网络工商
引用回复