dxy logo
首页丁香园病例库全部版块
搜索
登录

标准效应量(effective size)以及非参数检验的样本量计算

发布于 2020-11-06 · 浏览 4865 · IP 北京北京
这个帖子发布于 4 年零 192 天前,其中的信息可能已发生改变或有所发展。

——生物医学试验中合理的样本量是决定整个试验成败的重要因素之一。样本量需要多大?答案当然是“视情况而定”。

img

GraphPad Prism 官方统计教程中解释了样本量会受哪些因素影响。请注意,Prism不会进行任何样本量计算,但是会从几个不同的角度告诉大家如何决定合适的样本量、如何计算样本量等。

在前三篇【GraphPad Prism统计教程|关于样本量】中,我们为大家介绍了Prism如何帮助大家理解样本量的测定、如何预先选择样本量以及样本量相关重要值。还没看的小伙伴可以先回顾一下:

关于样本量的α和β

GraphPad能解决样本量的问题吗?

为何要预先选择样本量?


本篇继续围绕“样本量”,探究一下关于标准效应量(effective size)以及非参数检验的样本量计算。


主题一【效应量的标准值存在什么问题?】

01 标准效应量(standard effect sizes)确实很有吸引力

计算样本量要求你决定你想要的差异有多大。如果你的目标是找到微小差异,那么需要一个大的样本量。如果你是在寻找较大的差异,你可以用较小的样本量。

在一本很有影响力的书(1)中,Jacob Cohen对“当不知道要寻找多大的效果时该怎么做”提供了一些建议。 他将这些建议仅限于行为科学(Behavioral Sciences,他的专业领域),提出“所有一般性建议在某些情况下比其他情况更有用”。 以下是他的未配对t检验的指导原则:

  • 平均值之间的“小”差异等于标准差的五分之一;
  • “中”效应量等于标准差的一半;
  • “大”效应量等于标准差的0.8倍;

因此,如果你在确定要寻找的效果量时遇到困难(因此无法确定样本量),根据Cohen的建议,你可以选择“小”,“中”还是“ 大”效应,然后使用标准定义来解决。


02 标准效应量仍旧存在问题

Russell Lenth则认为应该尽可能避免这些“被限定的”效应量(指标准效应量)。他认为必须基于对当前的试验系统和提出的科学问题的理解,来决定目标差异要多大。Cohen关于标准效应量的建议似乎是一种忽略思考试验要点的方法,仅仅考虑到了所期望的分散(期望标准差)的差异,甚至忽略了平均值,这没有意义。

如果你选择α(0.05)、power(80%)和effect size(见上文),则无需进行任何计算;

如果你接受所有研究的标准定义(使用非配对的检验,比较两组),则所有研究每组需要有26个样本以检测“大”效应,每组需要有65个样本以检测“中”效应,每组需要有400个样本以检测“小”效应。


03 最后你需要知道...

选择标准效应量实际上与选择标准样本量相同。


References

[1] J. Cohen, Statistical Power Analysis for the Behavioral Sciences, 1988, ISBN=978-0805802832

[2] R. V. Lenth, R. V. (2001), "Some Practical Guidelines for Effective Sample Size Determination,'' The American Statistician, 55, 187-193. A preliminary draft was posted as a pdf file.


主题二【非参数检验的样本量】

01 通过非参数检验分析的数据样本量选择问题

你不愿意假设您的数据来自高斯分布时,使用非参数检验。常用的非参数检验是基于从低到高的秩值,然后查看组间秩和的分布。这是Wilcoxon秩和(测试一组与假设中值)、Mann - Whitney(比较两个非配对组)、Wilcoxon配对(比较两个配对组)、Kruskal - Wallis(三个或更多个非配对组)和Friedman(三个或更多个配对组)的基础。

计算非参数检验时,不需要对值的分布作出任何假设。这就是被称为非参数的原因。但如果你想通过非参数检验来计算一项待分析研究所需的样本量,你必须对值的分布作出假设。仅仅说分布不服从高斯分布还不充分,还必须说明其服从哪种分布。如果你愿意作出这一假设(例如假设值的指数分布、或均匀分布),可以查阅高级文本或使用更高级的程序来计算样本量。


02 一些可参考的经验法则

大多数人不知道潜在分布的形状时,他们会选择一个非参数检验。如果不对分布作出明确假设,则详细的样本量计算是不可能的。

但没有失去所有!根据分布的性质,非参数检验可能需要更多或更少的受试者。但如果满足以下两个假设,则所要求的额外受试者绝不会超过15%:

你正在查看数量相当高的受试者(有多高取决于分布和检验的性质,但该数字至少有几十个);

值的分布其实并不罕见(没有无限的尾部,在此情况下,其标准差会无限大)

因此,一般的经验法则是:

如果你计划使用非参数检验,则计算参数检验所需的样本量,然后加15%。


Reference

Erich L. Lehmann, Nonparametrics : Statistical Methods Based on Ranks, Revised, 1998, ISBN=978-0139977350, pages 76-81.



|| 往期内容回顾

高斯分布

Prism支持的图表格式与期刊要求

ROC曲线的绘制与解读

img

最后编辑于 2022-10-09 · 浏览 4865

1 16 3

全部讨论0

默认最新
avatar
1
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部