dxy logo
首页丁香园病例库全部版块
搜索
登录

转录组+代谢组专题(九) | 手把手教你如何上传转录组数据至NCBI

发布于 2021-08-06 · 浏览 1941 · IP 湖北湖北
这个帖子发布于 3 年零 269 天前,其中的信息可能已发生改变或有所发展。

导语

转录组原始数据的上传是进行转录组+代谢组文章投稿过程中的必不可少的一步。转录组数据最常见的上传数据库是NCBI的SRA数据库。下面是一篇纯干货,教大家如果上传转录组数据至SRA数据库。

SRA 数据上传包括几个平台,即:Bioproject,Experiment,Biosample,run。

每个平台具体的含义是:

  • Bioproject—SRA study: 研究目的-为什么要对样品进行测序;Biosample—SRA sample:用于测序的样品的具体描述性信息。SRA Experiment:具体测序是如何进行的,包括测序类型,机器型号,测序策略等信息。SRA run:数据上传。

例如一次测序中包括 5 个样本,则上传时包括 1 个 Experiment,1 个 Project,5 个 Biosample,5 个 run。所以上传数据包括几个内容的创建,而 Biosample 和 Bioproject 的创建是可以独立出来的。



一、账号注册


网址:https://www.ncbi.nlm.nih.gov/account/

点击如下图所示的“Register for a NCBI account”部分,并进入到注册页面。如果已在 NCBI 有用户名和密码,可以跳过此环节。

img

*按照提示注册,需要去注册邮箱完成验证,再登录





二、Bioproject 的创建


1.点击链接:https://www.ncbi.nlm.nih.gov/home/submit/,进入以下页面

img



2.点击 check the Status of Your Submissions,进入以下页面

img



3.点击 BioProject,进入以下页面

img



4.点击 New submission,填写其中的基本信息,填写内容真实,填写完成后点击continue。*号必填

img



5.进入以下页面,需要填写两个信息,1)测序数据类型,以转录组为例;2)单一物种还是多物种,以多物种为例,填写完成后点击continue。

img



6.进入以下页面,需要填写物种信息,填写完成后,点击Continue。

img



7.进入以下页面,需要填写三部分内容:1)数据即刻公开还是选择在特定时间公开。两个可以随机选择;2)Project title,这个系统自动匹配;3) Public description,公共描述,对上传的数据研究目的做一简单描述。填写完成之后,点击Continue。

img



8.这里需要填写样本信息,需要重新新建一个BioSample,此页面暂时保留。


img





三、新建BioSample

网址:点击https://submit.ncbi.nlm.nih.gov/subs/


1.点击 BioSample。

img



2.进入以下页面,点击 New submission。

img



3.进入以下页面,之前建BioProject的时候填过了,这里会自动补充。可以点击Continue。

img



4.进入以下页面。填写数据公开或者保密时间,可以选择与BioProject相同,即刻公开或者延迟几个月,填写完成后,点击continue。


img



4.进入以下页面。填写数据公开或者保密时间,可以选择与BioProject相同,即刻公开或者延迟几个月,填写完成后,点击continue。

img



5.进入以下页面,选择样本类型,植物还是动物,人,这里以植物为例,点击Continue。

img



6.进入以下页面,需要填写样本信息,点击Download Excel,下载需要填写的样本表格。

img



7.开始填写表格,绿颜色为必填,黄颜色为选填,蓝颜色为至少填写一个。

保证后面的描述是每个样本具有特异性,否则会一直上传失败。

img



8.将填好的样本信息表上传至下面红框里,点击Continue。

img



9.到达这步后,点击,Submit即可上传完成。

img



10.返回到刚开始的BioProject页面

填写Sample样本信息,将BioSample里的NCBI赋予每个样本的编号输入进去。点击Continue

img



11.在这个页面下,可以直接点击Continue。

img



12.进入如下页面,可直接点击submit。

img



13.进入如下页面,等待片刻,即可上传完成。

上传成功后,红框处会有一个NCBI提供的BioProject的编号,记住编号,后面会用。

img






四、上传SRA数据

1.点击链接,https://www.ncbi.nlm.nih.gov/Traces/sra_sub/,进入SRA数据上传网站。

进入网站后,点击第二个NCBI PDA选项

img



2.进入如下页面后,点击 Create new submission。

img



3.进入如下页面,点击new submission。

img



4.填写一些基本信息,这些之前已经填过了,所以这里系统会默认填充。点击Continue。

img



5.进入如下页面,需要填写三个内容。

1)是否建了一个BioProject项目,点击yes,输入上面提供的BioProject编号

2)是否建了一个BioSample项目,点击yes

3)数据是否公开,可跟前面保持一致。

填写完成后,点击Continue。

img



6.进入如下页面后,点击 Upload a file using Excel or text format (tab-delimited),点击Download excel,下载上传需要的sra表格。

img



7.填写下载的表格。

第一列是之前BioSample给的每个样本的编号,第二列是文库ID,变黄的可以在下拉里选择。

img



8.填写完表格后,点击选择文件将表格上传,后点击Continue。

img



9.进入以下页面,选择FTP上传,下载filezilla软件,按照第二个红框里给定内容,填写地址,账号,密码,输入文件夹信息,见第二张图,标红框处必填,否则无法登陆。

登录成功后,将测序原始数据拖到右面空白处,进行上传。可在下面框框里查看上传进展,等待数据完全上传成功。

img
img



10.数据上传成功后,返回刚刚的网页界面。

点击Select preload folder,会出现以下界面,点击refresh folders,系统会自动选中刚刚上传的数据,点击Use selected folder,会返回刚刚的界面,点击Continue,显示数据上传中,等待数据上传完毕,点击Continue。

img
img
img


以上就SRA数据上传的所有教程了

有需要的小伙伴们可以收藏备用哦。

最后编辑于 2022-10-09 · 浏览 1941

1 32 5

全部讨论0

默认最新
avatar
1
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部