GraphPad单因素方差分析-理论加实践

1 什么是ANOVA
单因素方差分析(“方差分析”) (one-way analysis of variance, one-way ANOVA)比较三个或更多独立组的均值,以确定相应的总体均值之间是否存在统计学上显著的差异[1-2]。或者可以这样理解单因素方差分析用于检验完单因素水平下随机设计的三个或多个样本均数间的比较,其统推断各样本所代表的各总体均数是否相等。值得注意的是,理论上这些比较数据是因变量必须是连续型变量,大量的符合正态分布的,实际上的数值可能不满足但依然可以使用这种统计办法,尤其是小样本(<50)。
2 何时才能使用ANOVA
当统计人员收集了一个分类自变量和一个定量因变量的数据时,使用单向方差分析。自变量应该至少有三个层次(即至少三个不同的组或类别)。方差分析告诉统计人员因变量是否根据自变量的水平而变化。方差分析的零假设(Null hypothesis,H0)是指组间均值不存在差异。另一种是备选假设(Alternative hypothesis,Ha)是至少有一组显著不同于因变量的总体平均值。
3 ANOVA执行差异检验
方差分析通过计算处理水平的平均值是否不同于因变量的总体平均值来确定自变量水平所创建的组是否有统计学差异。如果任何组均值与总体均值显著不同,则拒绝零假设。方差分析采用F检验进行统计学显著性检验。这允许同时对多个平均值进行比较,因为误差是针对整个比较每组计算的,而不是针对每个单独的双向比较(这将发生在t检验中)。F检验从整体组方差中比较各组均值的方差,如果组内方差小于组间方差,则F检验将发现更高的F值(F值越大差异越大),因此观察到的差异是真实的而不是偶然的可能性更大。
4 GraphPad单因素方差分析实操
本次GraphPad实践操作,针对实际样本<50,不一定符合连续变量和正态分布的数值进行单因素方差分析。当然,也可以进行适当的正态和方差齐性检验(意义不大)。
(1)新建column(使用较多)/group(使用较少)

(图1 新建column操作示意图)
(2)数据复制粘贴或导入或直接录入
A. 数据复制粘贴,直接将excel中分组的数据直接复制,然后粘贴至GraphPad输入框中,并将data tables命名以便后续查阅;

(图2 直接复制粘贴数据结果展示)
B. 数据导入方式:file- import-选择对应文件即可(不太推荐这种方式,有的时候会出错)

C 直接录入数据(针对数据较少的情况)
(3)正态分布检验
A. GraphPad正态分布检验操作,analyze -column analyses - column –normality and Lognormality tests,其余选择默认参数,GraphPad会根据多种统计方法进行正态分布检验。

(图3 GraphPad正态分布设置操作示意图)
B.正态分布检验结果解读
GraphPad利用传统的0.05临界值对被检测的数据,判断其是否能够通过正态性检验。检测是否符合正态分布依旧使用P值来判断,当P>0.05,则表示数据组符合正态分布,若P值≤0.05则表示数据组不符合正态分布。在面对较小的数据集时(<50),正态性检验没有足够的能力来检测与理想高斯值的适度偏差,因此正态性检验结果对后期的统计方式影响不是太大[3-6]。

(图4 GraphPad正态分布检测结果展示)
(4)方差齐性检验
A. 方差齐性检验基本设置,方差齐性检验在新版(8.1及以上)包含在单因素方差分析中,analyze- column analyses- one-way ANOVA (and nonparametric or Mixed)-选择所要检测组- ok。

(图5 GraphPad新版本单因素方差分析中包含方差齐性检验)
B. 方差齐性检验参数设置,在“Parameters: One-Way ANOVA (and Nonparametric or Mixed)”选择“No matching or pairing”+ “Yes. Use ANOVA,” + “Yes. Use ordinary ANOVA test.”即可。

(图6 方差齐性检验具体参数设置)
C.方差齐性检验结果解读,新版本只有Bartlett’s test检验,可见Bartlett’s test检验的P=0.0115≤0.05(也有解释<0.1),不满足方差齐性假设[7-8]。因此,对于小样本可以不用进行正态性和方差齐性检验检验。

(图7 方差齐性检验结果展示)
(5)单因素方差及多重比较
A.选择单因素方差分析,analyze- column analyses- one-way ANOVA (and nonparametric or Mixed)-选择所要检测组- ok。

(图8 单因素方差分析设置展示)
B.多重比较设置,一般选择Compare the mean of each column with the mean of every other column(可理解为所有组的两两比较),偶尔也会选择Compare the mean of each column with the mean of a control column(任意处理组与对照组两两比较);

(图9 多重比较的选择-任意两组或任意实验组与对照组的两两比较)
C.单因素检验方式选择,options- Tukey(recommended),当然下拉列表也有其他的检验方式,一般选择GraphPad推荐的检验方法。

(图10 GraphPad ANOVA检验方法选择展示)
D.ANOVA结果解读,根据ANOVA results展示的结果,最直观的描述了被检测所有组之间的差异是否存在显著性P<0.05,DFn>DFd表示差异显著,数值差异越大表示显著性越强。但ANOVA results无法展示组与组之间的差异。

(图11 ANOVA结果展示)
F. Multiple comparisons结果解读,我们可以从Multiple comparisons的结果看到组与组之间的差异情况,可见三组之间存在统计学差异。

(图12 Multiple comparisons结果展示)
(6)作图与标记差异性
A.点击Graphs-对应的数据-图形名称即可;

(图13 GraphPad作图操作展示)
B.图形横纵坐标编辑,直接点中图片的横坐标和主坐标删除(delete)即可,选中纵坐标然后输入需要输入的信息即可;

(图14 横纵坐标编辑展示)
C.标记显著性,选择无边框T,然后根据显著差异性进行字母标记;

(图15 差异标记展示)
D.字体设置,将所有文字选中,然后选中需要的字体,具体操作如图16所示。

(图16 图形中字体格式设置操作展示)
(7)图形美化
图形的美化,主要设计柱子颜色(需要根据不同组进行填充)、边框颜色/粗细(一般用默认)、误差线颜色/粗细/样式(一般用默认)。

(图17 柱状图颜色,边框粗细/颜色/样式等参数设置)
5 结束。
爱自己!!!做科研!!! 每文格言“贝尔实验室的物理学家 Ravin Bhatt 讲过:“一般地讲,如果一般的科学家的这个数为“一”,就是说他的自我吹嘘和获得的成就是一致的,那么成绩就很不错了;但大多数人的这个数是低于“一”,就是都在自我吹嘘,其实成就没有那么大。”巴丁数(Bardeen number),即一个人的成就除上他的自我吹嘘,表示一个人的谦虚程度。”如果有用,关注楼主GBhouse,点赞+讨论,攻击型人格请请请不要关注和阅读!!!
参考:
[1] https://www.statology.org/one-way-anova/
[2] https://www.scribbr.com/statistics/one-way-anova/
[3] https://www.sohu.com/a/486591809_120314002
[4] P Royston, Remark AS R94: A Remark on Algorithm AS 181: The W-test for Normality. Journal of the Royal Statistical Society. Series C (Applied Statistics), Vol. 44, No. 4 (1995), pp. 547-551
[5] RB D'Agostino, "Tests for Normal Distribution" in Goodness-Of-Fit Techniques edited by RB D'Agostino and MA Stephens, Macel Dekker, 1986.
[6] Dallal GE and Wilkinson L (1986), "An Analytic Approximation to the Distribution of Lilliefors's Test Statistic for Normality," The American Statistician, 40, 294-296.
[7] https://mengte.online/archives/12786
[8] https://www.graphpad-prism.cn/guides/prism/10/statistics/stat_what_to_do_when_the_groups_hav.htm
最后编辑于 2024-08-07 · 浏览 2514