dxy logo
首页丁香园病例库全部版块
搜索
登录

(转需)分享18种有趣的科研图表的绘制方法

发布于 2023-12-13 · 浏览 4504 · 来自 Android · IP 广东广东
这个帖子发布于 1 年零 149 天前,其中的信息可能已发生改变或有所发展。
icon墨点星沟 推荐

1.彩色标签条形图



条形图,展示分析结果直观明了,绘制方法非常简单,在科研数据的展示中占有非常重要的地位,差不多每篇学术论文都可以看到它。可是,条形图看似简单,但有些条形图的绘制还是有一点难度的,比如下图这样的。


img



我们可发现上图最大特点(也是绘制难点)是“两级”刻度标签的添加,并且使坐标轴(Y轴)刻度标签的颜色是与“条形”的颜色是完全一致的,这里其实涉及到数字“0”和空值的妙用。关于这类图表的绘制,比如气泡图,箱型图,小提琴图等,其实利用ggplot2包的一个小小的“Bug”就可以完美实现。


#读入数据;

dt1<-read.table("koenrich.xls",sep = "\t",header = T)

#指定纵轴标签顺序,按照输入文件的顺序排序,否则默认按照首字母顺序,同时逆序绘制,保持与表格顺序一致;

dt1$KEGG_A_Class<-factor(dt1$KEGG_A_Class,

                         levels = rev(unique(dt1$KEGG_A_Class)),

                         ordered = TRUE)

dt1$KEGG_B_Class<-factor(dt1$KEGG_B_Class,

                         levels = rev(unique(dt1$KEGG_B_Class)),

                         ordered = TRUE)

# 加载ggplot2包;

library(ggplot2)

#建立数据(Genes.Number, KEGG_B_Class)与图形(点)的映射关系;

p1<-ggplot(dt1, aes(x=Genes_Number,

                    y=KEGG_B_Class,

                    fill=KEGG_A_Class,na.rm = FALSE))+

  geom_bar(stat="identity",na.rm = FALSE)+

 geom_text(aes(x=Genes_Number,y=KEGG_B_Class,label=label),size=2.5,hjust="left",nudge_x=0.1)+

  scale_x_continuous(limits = c(0, 25),expand=expansion(mult = c(0, .1)))+

  labs(x="Number of Gene",y="",title="KEGG pathway anotation")

p1


#获取颜色;

g <- ggplot_build(p1)

mycol<-g$data[[1]]["fill"]

col<-rev(mycol[,1])

#将A Class对应的颜色设为深黑色;

num <- rev(dt1$Genes_Number)

index <- which(num==0)

col[index] <- "grey10"


img



#自定义图表主题,对图表做精细调整;

top.mar=0.2

right.mar=0.2

bottom.mar=0.2

left.mar=0.2

mytheme1<-theme(plot.title = element_text(size = rel(1),hjust = 0.5,face = "bold"),

                          axis.title = element_text(size = rel(1)),

                          axis.text.y = element_text(size=rel(0.85),

                                                     colour =col,face = "bold"),

                          legend.position = "none",

                          plot.margin=unit(x=c(top.mar,right.mar,

                                               bottom.mar,left.mar),

                                           units="inches"))

#查看绘图效果;

p1+mytheme1


img


详细教程链接:

《如何绘制好看的条形图?标签颜色相对应的这种。。。》





2.发散PCA散点图



PCA (Principal Component Analysis) 散点图,是科研文章中常见的一类散点图。下面就以PCA散点图为例,为大家介绍如何使用ggplot2绘制好看的散点图。


#读入数据;

dt <- read.csv("PCA_data.csv")

#载入ggplot2绘图包;

library(ggplot2)

library(ggh4x)


#绘制实心散点图;

p1 <- ggplot(dt,aes(x=PC1,y=PC2,fill=Diagnosis))+

  stat_centroid(aes(xend = PC1, yend = PC2, colour = Diagnosis),

                geom = "segment", crop_other = F,

                alpha=0.3,size = 1,show.legend = F)+

  geom_point(size=3,alpha=0.7,

             color="white",shape = 21,show.legend = T)+

  scale_color_manual(name="",

                     values = c("#FF9999","#c77cff"))+

  scale_fill_manual(name="",

                     values = c("#FF9999","#c77cff"))+

  scale_x_continuous(expand=expansion(add = c(0.7,0.7)),

                     limits=c(-10,5))+

  scale_y_continuous(expand=expansion(add = c(0.5,0.5)),

                     limits=c(-7.5,5))+

  guides(x = "axis_truncated",y = "axis_truncated")


p1


img


详细教程链接:

《不就是PCA图么,还能有什么新花样?》





3.漂亮的玫瑰图



条形图(或柱状图)是科研文章中比较常见的数据展示方式。除了墨守常规的样式,其实你也可以试试南丁格尔玫瑰图,特别是当你的数据具有周期性的时候,比如四季变化、昼夜节律等,非常适合。


#读入数据;

dt <- read.csv("test_data.csv")

#实用month.abb[]将月份转换为英文缩写;

dt$Month <- month.abb[dt$Month]

#载入相关的R包;

library(dplyr)

library(ggplot2)

#转成tibble格式;

df <- as_tibble(dt)

#将月份转换成因子,固定顺序;

df$Month <- factor(df$Month,levels = unique(df$Month),ordered = T)

#将季度数值转成字符;

df$Quarter <- as.character(df$Quarter)


#提取作图数据;

df1 <- filter(df,Group=="Day")

#自定义颜色;

subcol<-rainbow(12)

mycol1<-colorRampPalette(subcol[1:4])(12)

mycol2<-colorRampPalette(c("#A5CC26","yellow","orange","tomato"))(12)


#绘制相互叠合的玫瑰图;

p1 <- ggplot(df1,aes(x = Month, y=Length,fill=Month))+

  geom_col(width = 1.2,color=NA,alpha=1)+

  geom_text(aes(label = Length),nudge_y=-2,

            colour="white",size=3)+

  ylim(-1.2,17)+

  scale_fill_manual(values = mycol1)+

  coord_polar(start = 0)+

  theme_void()

p1


img



详细教程链接:

《遥遥领先!如何绘制漂亮的玫瑰图?》





4.富集分析圈图



OmicShare的GO、KEGG富集分析工具非常强大,只需上传目的基因文件,即可进行常见物种的GO、KEGG富集分析。分析结果中,直接包含数据可视化结果,比如柱状图、圈图、网络图等。


img


工具链接:

https://www.omicshare.com/tools/Home/Soft/gogseasenior

https://www.omicshare.com/tools/Home/Soft/pathwaygseasenior


详细教程链接:

《如何绘制GO、KEGG富集圈图》





5.相关性网络热图



网络热图,应用于多组学关联分析,可展示组学内(热图)和组学间(网络图)的相关性结果。其中,组学内相关性热图,用于展示每两个元素(环境因子、代谢物、性状等)之间相关系数;组学间相关性网络图,可展示16S-OTU、宏基因组-物种、基因等丰度信息与相关性数据文件每个元素之间的相关性。

img


工具链接:

https://www.omicshare.com/tools


详细教程链接:

《推荐一个绘制Science网络热图的在线工具》





6.漂亮的桑基图



桑基图(SanKey Plot)非常适合展示数据的流动变化,输入关联分析数据或其他数据绘制桑基图,查看数据的流向,或展示数据间的关联。

img


工具链接:

https://www.omicshare.com/tools/home/report/report_sankey.html


详细教程链接:

《你的论文中还缺一张“NB闪闪”的美图?》





7.多组差异散点图



多组差异散点图,以组间差异倍数的对数值log2FC为纵坐标,以比较组的名称为横坐标,可一次性展示多个比较组的差异基因。一般而言,对于传统的火山图,一张图一次只能展示一个比较组的差异基因,而多组差异散点图可视作多组“火山图”,可一次性展示多个比较组的差异基因。

img


工具链接:

https://www.omicshare.com/tools/home/report/report_diff_scatter_chart.html


详细教程链接:

《分享一种“过于先进,不宜展示”的图表绘制方法》





8.自定义标签热图



热图,主要使用渐变颜色来展现数据在不同样本中的变化规律,工具除了支持为热图添加分组注释条,也可以指定展示特定的文字标签,即使绘制上百个基因的热图,基因标签也不会重叠在一起。


img


工具链接:

https://www.omicshare.com/tools/Home/Soft/heatmap


详细教程链接:

《如何绘制“春日风格”的个性标签热图?》





9.动态交互韦恩图



韦恩图(Venn diagram)用于展示不同数据集之间的交集情况,在韦恩图中一般以椭圆、正圆等图形代表不同的数据集,以图形之间的重叠区域代表数据集之间的交集情况。下面为大家推荐一个强大的韦恩图在线工具,可以轻松完成多分组韦恩图的绘制。


工具链接:

https://www.omicshare.com/tools/home/report/reportvenn.html


该工具支持通过“筛选后”的元素数据文件或“筛选前”的丰度数据文件绘制韦恩图,并支持查看和提取子集部分的元素信息。


img



详细教程链接:

《如何绘制漂亮的韦恩图,可以提取子集元素的那种?》





10.环状网络图



环状网络绘制方法其实比较简单,除了使用Cytoscape软件,使用ggraph包可实现网络图的绘制。


#载入所需的绘图包;

library(ggraph)

library(tidygraph)

library(igraph)

library(ggplot2)

#读入边文件和节点信息文件;

net <- read.csv("edge_data.csv")

info <- read.csv("node_info.csv")

#预览数据;

head(net)

head(info)


#创建网络图对象;

g <- tbl_graph(nodes = info,edges = net,directed = F)

#计算网络图的degree属性;

V(g)$degree <- degree(g)

#自定义颜色;

mycol <- c("#FF8901","#00C5FF","#FF5485")


#绘制环状网络图(曲线连线);

p1 <- ggraph(g, layout = 'linear',circular = TRUE)+

  geom_edge_arc(colour="grey50",width=1,alpha=0.3)+

  geom_node_point(aes(color=class),size=6,alpha=0.8)+

  scale_colour_manual(values = mycol)+

  geom_node_text(aes(x = 1.05 * x,y = 1.05 * y,

                     angle = -((-node_angle(x, y) + 90) %% 180) + 90,

                     label=name),

                 nudge_y = 0,

                 hjust = 'outward',

                 repel = F,

                 size=2.5)+

  coord_fixed(clip = "off")+

  theme_graph()

p1


img


详细教程链接:

《网络图画成这样,是什么水平?》





11.星号标记热图



一般在绘制常规的相关性热图后,根据pvalue数值继续在热图上添加显著性标记(星号),如下图。



详细教程链接:

《如何绘制带有显著性“星号”的热图?》





12.正负号标记热图



除了在热图上添加显著性标记,我们也可以使用“正负号”标记正相关和负相关,如下图,或者仅显示某一范围的相关性系数值。


img


详细教程链接:

《如何绘制带有“正负号”标记的热图?》





13.环形热图



环状热图可与环形聚类树结合使用,看起来很整洁美观,特别适合展示不同分组基因的表达数据。


img


详细教程链接:

《热图也开始“内卷”——环形热图如何绘制?》





14.网络韦恩图



网络韦恩图,用以展示不同分组之间共有或特有的基因,特别是当分组元素数量较少时,数据展示效果更加直观。


img


详细教程链接:

《如何绘制各种高颜值的网络韦恩图?》





15.好看的火山图



火山图(Volcano plot)是一种比较“远古”的一种散点图,广泛应用于转录组、蛋白组等组间差异分析结果的展示。图表的横轴一般展示差异倍数的变化,而纵轴表示差异分析结果的可靠性。


img



我这里对传统的火山图做了进一步的优化,比如通过调整点的大小突出展示感兴趣基因对应的点,并将感兴趣基因的名称以标签的方式展示出来。那么,如何绘制这般个性又好看的火山图呢?我这里主要用到的还是最常见的ggplot2包。


详细教程链接:

《如何绘制新颖好看的火山图?》





16. t-SNE散点图



在单细胞转录组数据分析中,t-SNE散点图是展示细胞亚群图谱的重要手段,而Seurat的标准绘图效果并不能做更多调整,不过我们可以提取数据使用ggplot2重新绘制!


img



详细教程链接:

《如何提取Seurat数据,绘制更加个性化的tSNE/UMAP图?》





17.双坐标轴图表



转录组测序后,往往需要用qPCR结果去验证,我们常常需要绘制双坐标轴图表进行比较,如下图,左侧的坐标轴对应Q-PCR的结果(柱状图),右侧的坐标轴对应RNA-seq的测序结果(折线图)。


img


详细教程链接:

《验证组学数据?试试绘制双坐标轴图表》





18.上下对称组合图



上下对称图表适合展示两组量纲不同却具有一定相关性的数据,如下图。图表的下部分表示一段时间内的降雨量(mm)变化,而上部分则表示相应时段对应的蒸发量(m3/s)。


img



详细教程链接:

《如何绘制更落落大方的上下“对称”图表?》


好啦,本次的科研图表绘制技巧就分享到这里啦!


最后编辑于 2023-12-13 · 浏览 4504

1 36 3

全部讨论0

默认最新
avatar
1
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部