标准效应量(effective size)以及非参数检验的样本量计算
——生物医学试验中合理的样本量是决定整个试验成败的重要因素之一。样本量需要多大?答案当然是“视情况而定”。

GraphPad Prism 官方统计教程中解释了样本量会受哪些因素影响。请注意,Prism不会进行任何样本量计算,但是会从几个不同的角度告诉大家如何决定合适的样本量、如何计算样本量等。
在前三篇【GraphPad Prism统计教程|关于样本量】中,我们为大家介绍了Prism如何帮助大家理解样本量的测定、如何预先选择样本量以及样本量相关重要值。还没看的小伙伴可以先回顾一下:
本篇继续围绕“样本量”,探究一下关于标准效应量(effective size)以及非参数检验的样本量计算。
主题一【效应量的标准值存在什么问题?】
01 标准效应量(standard effect sizes)确实很有吸引力
计算样本量要求你决定你想要的差异有多大。如果你的目标是找到微小差异,那么需要一个大的样本量。如果你是在寻找较大的差异,你可以用较小的样本量。
在一本很有影响力的书(1)中,Jacob Cohen对“当不知道要寻找多大的效果时该怎么做”提供了一些建议。 他将这些建议仅限于行为科学(Behavioral Sciences,他的专业领域),提出“所有一般性建议在某些情况下比其他情况更有用”。 以下是他的未配对t检验的指导原则:
- 平均值之间的“小”差异等于标准差的五分之一;
- “中”效应量等于标准差的一半;
- “大”效应量等于标准差的0.8倍;
因此,如果你在确定要寻找的效果量时遇到困难(因此无法确定样本量),根据Cohen的建议,你可以选择“小”,“中”还是“ 大”效应,然后使用标准定义来解决。
02 标准效应量仍旧存在问题
Russell Lenth则认为应该尽可能避免这些“被限定的”效应量(指标准效应量)。他认为必须基于对当前的试验系统和提出的科学问题的理解,来决定目标差异要多大。Cohen关于标准效应量的建议似乎是一种忽略思考试验要点的方法,仅仅考虑到了所期望的分散(期望标准差)的差异,甚至忽略了平均值,这没有意义。
如果你选择α(0.05)、power(80%)和effect size(见上文),则无需进行任何计算;
如果你接受所有研究的标准定义(使用非配对的检验,比较两组),则所有研究每组需要有26个样本以检测“大”效应,每组需要有65个样本以检测“中”效应,每组需要有400个样本以检测“小”效应。
03 最后你需要知道...
选择标准效应量实际上与选择标准样本量相同。
References
[1] J. Cohen, Statistical Power Analysis for the Behavioral Sciences, 1988, ISBN=978-0805802832
[2] R. V. Lenth, R. V. (2001), "Some Practical Guidelines for Effective Sample Size Determination,'' The American Statistician, 55, 187-193. A preliminary draft was posted as a pdf file.
主题二【非参数检验的样本量】
01 通过非参数检验分析的数据样本量选择问题
你不愿意假设您的数据来自高斯分布时,使用非参数检验。常用的非参数检验是基于从低到高的秩值,然后查看组间秩和的分布。这是Wilcoxon秩和(测试一组与假设中值)、Mann - Whitney(比较两个非配对组)、Wilcoxon配对(比较两个配对组)、Kruskal - Wallis(三个或更多个非配对组)和Friedman(三个或更多个配对组)的基础。
计算非参数检验时,不需要对值的分布作出任何假设。这就是被称为非参数的原因。但如果你想通过非参数检验来计算一项待分析研究所需的样本量,你必须对值的分布作出假设。仅仅说分布不服从高斯分布还不充分,还必须说明其服从哪种分布。如果你愿意作出这一假设(例如假设值的指数分布、或均匀分布),可以查阅高级文本或使用更高级的程序来计算样本量。
02 一些可参考的经验法则
大多数人不知道潜在分布的形状时,他们会选择一个非参数检验。如果不对分布作出明确假设,则详细的样本量计算是不可能的。
但没有失去所有!根据分布的性质,非参数检验可能需要更多或更少的受试者。但如果满足以下两个假设,则所要求的额外受试者绝不会超过15%:
你正在查看数量相当高的受试者(有多高取决于分布和检验的性质,但该数字至少有几十个);
值的分布其实并不罕见(没有无限的尾部,在此情况下,其标准差会无限大)
因此,一般的经验法则是:
如果你计划使用非参数检验,则计算参数检验所需的样本量,然后加15%。
Reference
Erich L. Lehmann, Nonparametrics : Statistical Methods Based on Ranks, Revised, 1998, ISBN=978-0139977350, pages 76-81.
|| 往期内容回顾

最后编辑于 2022-10-09 · 浏览 4865