• 论坛首页
  • 我的丁香客
  • 找人
    查找好友
  • 更多
    丁香园
    丁香通
    丁香人才
    丁香会议
    丁香搜索
    丁香医生
    丁香无线
    丁香导航
    丁当铺
    文献求助
    医药数据库
    丁香诊所
    来问医生
登录 注册

生物信息

关注今日:5 | 主题:139826
论坛首页  >  生物信息学讨论版   >  NGS & Microarray
  • 发帖
    每发1个新帖
    可以获得0.5个丁当奖励
  • 回帖

分享到:

  • 微信

    微信扫一扫

  • 微博
  • 丁香客
  • 复制网址

求助关于illumina HiSeq 2000数据分析问题

  • 只看楼主
  • 页码直达:
  • 直达末页
楼主 英菲尼迪
英菲尼迪
入门站友

  • 0
    积分
  • 3
    得票
  • 137
    丁当
  • 1楼
这个帖子发布于6年零270天前,其中的信息可能已发生改变或有所发展。
问题已关闭悬赏丁当:5
最近在TCGA上下载的illumina HiSeq 2000的数据,但是不知道怎么分析。我的数据包括:
genes,
genes normalized,
exon,
isoforms,
isoforms normalized
junction
六部分,每一部分都是单独的一个文件。
其中
genes包括gene_id,raw_count,scaled_estimate,transcript_id;
genes normalized包括gene_id,normalized_count;
exon包括exon,raw_counts,median_length_normalized,RPKM;
isoforms包括isoform_id,raw_count,scaled_estimate;
isoforms normalized包括isoform_id,normalized_count;
junction包括junction,raw_counts。
我想从中挑选我感兴趣的基因在不同样本中的表达情况,但是不知道对差异表达基因分析应该用哪些数据。下图是对应的部分数据,请高手详细指教。





  • 邀请讨论
  • 不知道邀请谁?试试他们

    换一换
2014-04-28 15:04 浏览 : 5816 回复 : 3
  • 投票 1
  • 收藏 5
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 首套【肺石医生】表情上架啦,一起斗图吧!
thebeast
thebeast
入门站友

  • 0
    积分
  • 0
    得票
  • 24
    丁当
  • 2楼
要看表达差异的话,要用RPKM值来做。
2014-04-29 17:52
  • 投票
  • 收藏
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • #医生的昵称有多好笑#这是你们热爱工作的表现吗?哈哈哈哈
楼主 英菲尼迪
英菲尼迪
入门站友

  • 0
    积分
  • 3
    得票
  • 137
    丁当
  • 3楼
嗯,我想知道我的数据应该怎样计算RPKM,请详解,只用我的数据,不需要RPKM公式。非常感谢了!
2014-05-01 03:52 来自 3G版
  • 投票
  • 收藏
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 腹腔镜下乙状结肠癌根治术(NOSES IV 式)
liubinxu
liubinxu
常驻站友

  • 1
    积分
  • 5
    得票
  • 11
    丁当
  • 4楼
RPKM = (raw_count * 10^9) /(len * all_count)
raw_count 就是原始的reads数
all_count 就是所有的reads数 就是把所有的raw_count都加起来
len 是基因长度 比较难算,可以看一下别的列有没有
2014-05-13 13:05
  • 投票 1
  • 收藏
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 【话题活动】#有没有患者的哪一句话,戳中了你的泪点?

关闭提示

需要2个丁当

丁香园旗下网站

  • 丁香园
  • 用药助手
  • 丁香通
  • 文献求助
  • 丁香人才
  • 丁香医生
  • 丁香导航
  • 丁香会议
  • 手机丁香园
  • 医药数据库

关于丁香园

  • 关于我们
  • 丁香园标志
  • 友情链接
  • 联系我们
  • 加盟丁香园
  • 版权声明
  • 资格证书

官方链接

  • 丁香志
  • 丁香园新浪微博
引用回复