用手机完成一篇5+分的生信文章!
前前言
还记得之前给大家介绍的一篇纯生信分析的文章么:Dysregulation of Signaling Pathways Due to Differentially Expressed Genes From the B-Cell Transcriptomes of Systemic Lupus Erythematosus Patients – A Bioinformatics Approach .
点击此处回看: 会用鼠标就能发文章系列之:非肿瘤的生信分析!
周末闲来无事,决定用手机试试复现这篇5+分的文章!由于初次操作,文件处理等方面比较费劲,文中截图可以看出花了一整天时间(06:54 ~ 20:31)。
也算为大家分享几个不错的在线分析工具!
快去分享给你的老板吧,让他知道WB间隙你没有打王者,你还在分析数据呢!
前言
传统生信1.0分析的基本模式为:
一、 差异分析:疾病组 v.s. 对照组,寻找差异基因,筛选出哪些基因在疾病发生发展中发挥功能;
二、绘制火山图或热图:直观的展示差异基因,
三、蛋白互作网络图(protein-protein interaction network ):将差异基因输入STRING等数据库中,构建一个基因相互作用的网络图,从而了解哪些基因在疾病发生发展中协同发挥作用;
四、发现核心基因集:根据基因相互作用的权重(某基因与多少个基因相互作用),筛选出差异基因中的发挥核心功能的基因集;
五、发现核心基因:原理同上,如果某个基因和多个基因互作,说明它可能影响多个基因发挥功能,也就是说它在疾病发生发展中发挥比其他基因更重要的功能;
六、GO/KEGG功能富集分析:根据不同基因的功能进行富集归类,探索哪些生物学功能在疾病发生发展中发挥作用,指导下一步研究方向;
总之:1.0的生信分析就是通过差异分析寻找在疾病发生发展中起关键作用的基因或生物学功能,以指导下一步细胞及动物实验。
!!!具体步骤如下:
差异分析

GEO官方网站分析工具:https://www.ncbi.nlm.nih.gov/geo/geo2r/?acc=GSE30153
1. 在GEO数据库中选择GSE30153数据集;
2. 在数据集下方选择GEO2R工具,并将数据集中数据分组(p=patients,c=control);
3. 点击TOP250下载差异最显著的250个;点击Save all results获取所有差异分析结果;

4. GEO2R的结果直接呈现在网页上,我在分享中通过夸克这个软件下载到了差异分析数据集。


绘制火山图

在线绘制火山图工具: http://www.chrislifescience.club:3838/R/AnnoE2/
采用WPS软件按网站要求将差异分析文件head做一下改动,上传至网站,调节出图参数,火山图就完成了!


构建蛋白互作网络图

需要用到的网站:
b. https://www.networkanalyst.ca/
步骤如下:
1. 在STRING数据库中输入TOP250基因,查询互作关系,并下载互作关系文件(tsv格式);

2. 在WPS中提取互作基因并保存为txt文件;

3. 打开networkanalyst网站,选择network file 工具;

4. 导入准备好的txt文件,点击processed,完成PPI图。(可以通过View和Layout等菜单调节展示图)



5. 在Module Explorer 中选择不同计算方式,导出cluster,在左侧将cluster1/2以外的基因删除,这样就提取出来network的核心cluster;(这部分图略)(后文通过另一个软件呈现)

6. 如果有生存资料,可以进一步提取高Degree的hub基因,进行生存分析;

功能富集分析



功能富集分析网站:http://metascape.org/gp/index.html#/main/step1
在对话框粘贴TOP250基因,富集分析图就出来了!

另外这个网站后还附带PPI图及Cluster分析,完美呈现cytoscape+MCODE功能。

P.S.
忘了说了,全程操作采用华为手机,华为手机真的溜啊!
iPhone就不要想了,默默打王者去吧!
最后编辑于 2022-10-09 · 浏览 6413