dxy logo
首页丁香园病例库全部版块
搜索
登录

TCGA数据库下载数据整理(二)

发布于 2021-10-11 · 浏览 1325 · IP 广东广东
这个帖子发布于 3 年零 203 天前,其中的信息可能已发生改变或有所发展。

昨天讲解了将Esymbolid文件放在一个文件夹里全部解压缩,今天我们要讲的是,将样本名称和样本的表达量一一对应,构建成我们提到过的那个矩阵。

img

这里需要medata文件,里面包含所有样本的样本名称,我们要将所有的样本名称和每一个Esymbolid里面的每一个样本的基因表达量一一对应起来。

img

要执行这个操作,需要用到一个脚本文件,就是这个脚本文件,

img

如果大家需要的话,可以在科研风雨路的后台留言,我们发给您。

 接下来就是具体的操作过程,打开昨天我们创建的files文件夹,将这两个文件merge.pl和medata文件复制到files文件夹里,

img

调用perl:在搜索框中输入cmd,点击命令提示符,

img

img

输入cd加空格,加复制黏贴files文件夹的路径,按回车,接下来输入perl加空格,加复制黏贴脚本名称,加空格,同时将medata文件名复制黏贴,上图,然后按回车,等光标回到大于号后,我已经运行过了,所以就没有按回车了。

img

然后点击gdc文件夹,就可以看到一个matrix文件夹了,里面就是按我们要求转换好的矩阵了。打开以后如下图所示。

img


img


 大家先学习一下,如果有看不懂的地方,可以在后台留言,我们会一一给予解答的,明天我们还会出一期视频,来帮助大家掌握这个操作过程。如果觉得这个视频对你们有用的话,欢迎关注,点赞和分享,让更多的人看见,谢谢大家。

最后编辑于 2022-10-09 · 浏览 1325

3 12 4

全部讨论0

默认最新
avatar
3
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部