dxy logo
首页丁香园病例库全部版块
搜索
登录

利用gdc-client工具下载TCGA数据

临床医学其他学科医学生 · 最后编辑于 2022-10-09 · IP 广东广东
1.7 万 浏览
icondachong99 +8 丁当
这个帖子发布于 5 年零 287 天前,其中的信息可能已发生改变或有所发展。

一、下载manifest文件

在TCGA网站选好数据,后点击manifest下载文件。

img

注意:Cart文件夹大于50M时,只能通过Data Transfer Tool工具进行下载,否则下载的数据很有很可能不全或下载失败。

二、下载工具及环境准备

1、打开工具下载网站:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool。按照电脑系统下载相应的工具,我们以win10为例说明。

img

2、将下载好的gdc-client工具(解压)和manfiest文件放在同一个文件夹下,方便整理。

img

注意:把该工具解压到下面这个文件夹,根据图标,说明这个软件是用Python写的,然后使用Pyinstaller打包的。因此该软件不能解压到含有中文名的文件夹下,否则会报错,不能使用!!!

3、win+R调出命令窗口,输入"cmd”确定。

输入:程序安装路径 -h

img

提示程序正常运行。

4、把gdc-client加入环境变量

我还没把这个软件加入环境变量,所以我是用他就要加入其所在的路径,如果以后想在任何一个路劲简单使用gdc-client这个命令,那就需要把这个软件的路径加到环境变量。就是在Path加入刚刚软件所在的路径即可”。具体操作如下:打开电脑控制面板——系统和安全——系统——高级系统设置——环境变量——Path双击——在下面空白栏加入程序所在路径,然后应用保存。


img

现在只要简单输入gdc-client -h 这个命令就可以了。

如果这里不加入环境变量的话,后面下载数据需要在gdc-client前面加上文件路径!

比如:C:\Users\***>E:\Rsudio_workstation\TCGA\GDC\gdc-client.exe download -m E:\Rsudio_workstation\TCGA\GDC\gdc_manifest_clin.2021-07-26.txt

5、使用gdc-client下载TCGA数据

gdc-client download -m D:\Tool\gdc-client_v1.4.0_Windows_x64\gdc_manifest.2019-10-02.txt

在以上代码中注意加上蓝色部分manifest文件的路径,否则会报错。

img

这样等数据下载完就可以了。

6、整理下载好的数据

下载好的数据在上述代码起始的文件夹下,本例数据在c:\Users\axer路径下。

img

找到后将数据整理到一个新建的文件夹clinical进行下一步分析处理。

下面,利用R语言将下载好的数据进行提取和合并。

R语言整理gdc-client工具下载的TCGA数据

Data_Transfer_Tool_使用说明.pdf (1.5 MB)
41 127 9

全部讨论(0)

默认最新
avatar
41
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部