dxy logo
首页丁香园病例库全部版块
搜索
登录

样本量的α和β

发布于 2020-11-05 · 浏览 1729 · IP 北京北京
这个帖子发布于 4 年零 193 天前,其中的信息可能已发生改变或有所发展。

“生物医学试验中合理的样本量是决定整个试验成败的重要因素之一。样本量需要多大?答案当然是“视情况而定”。”


img

GraphPad Prism 官方统计教程中解释了样本量会受哪些因素影响。请注意,Prism不会进行任何样本量计算,但是会从几个不同的角度告诉大家如何决定合适的样本量、如何计算样本量等。

之前的两篇文章是关于样本量的测定和为何要预先估算样本量的,本篇继续围绕样本量这个话题,一起来看看与样本量相关的两个重要值——α和β。

↓ 相关文章回顾:

GraphPad能解决样本量的问题吗?

为何要预先选择样本量?


01 标准值

在计算样本量时,多数科研人员会选择α和β的标准值。通常设置α=0.05、β=0.20(允许Power 80%)。

标准方法的好处是大家都会选择这个方法,也不需要太多的考量。但作为一般方法,它并不能很好地决定样本量。


02 根据科学背景谨慎选择α和β

在计算样本量时,应该根据试验设置以及产生I型或II型错误的后果来选择α和power的值。

可以尝试思考这样的场景:

I型错误表明某药物有效,而实际上并非如此。 II型错误可以断定某种药物无效(实际上是有效的)。 但是,产生I型或II型错误的后果取决于试验背景。 这里有A, B, C, D四种情况:

【A】

从庞大的化合物库中筛选药物,但缺乏科学的筛选依据。 你知道某些“命中”将是假阳性(I型错误),所以打算在另一种检验法中检验所有的“命中”。也就是说,I型错误的结果是你需要重新检验该化合物。 如果不想重新检验太多的化合物,就不能让α变大。 将其设置为一个较高的值(也许是0.10)就可能很有意义。 当你推断某种药物没有统计学上的显著作用,但实际上这个药物有效时,就会发生II型错误。 然而在这种情况下,你还有数十万种药物待检验,并且不可能实现完全检验。 通过选择较低的Power(如60%),就可以实现较小的样本量。一些真正的药物可能被错过,但此时你可以以同样的精力进行更多次检验。 在这种背景下,将alpha设置为较高的值是合理的。

→总结:低Power,高α

【B】

通过科学逻辑筛选出药物。 I型错误产生的后果与之前一样,可以证明α=0.10是合理的。 但是,II型错误产生的后果在这个情况下更为严重。 因为你已经谨慎地筛选了这些化合物,因此II型错误意味着可能会忽略优质药物。 在这种情况下,要将Power设置为较高的值。

→总结:高Power,高α

【C】

对筛选的药物进行仔细检验,且没有机会进行第二轮。 假设这些化合物会不稳定,因此你只能在一个实验中使用它们。 该试验的结果—命中和未击中的列表—将用于建立结构-活性关系,然后将其用于提出化学家们要合成的新化合物列表。 这将是一项昂贵且耗时的任务,无法轻易重复。 在这种情况下,I型和II型错误产生的后果都非常严重,因此将α设置为较小的值(例如0.01),将Power设置为较大的值(可能为99%)。 这也意味着你需要更大的样本量。

→总结:高Power,低α

【D】

重新考虑场景【C】。因为【C】所需的样本量可能太大而无法实现(无法运行)。深思熟虑后,你认为I型错误(错误地认为药物有效)的后果要比II型错误(缺少真实药物)的后果严重得多。 一次错误的选择可能会对你的结构活性研究(Structure-Activity Studies)产生巨大影响,并导致后续合成错误的化合物。 但错误地将一种药物称为无效药物,所带来的后果相对没有那么严重。 此时,较低的α值和较低的Power才是明智之选。

→总结:低Power,低α


03 最后......

上述情况都是人为设想的,至于如何设计你自己的药物筛查,他人是无法给你直接建议的。 通过这些设想的情况,你需要仔细考虑了产生I型和II型错误的后果,然后选择合适的α和Power的值。 这些都需要基于科学试验背景。

再回头看看标准值,就显得缺乏实际意义了。如果是你,你会如何衡量呢?



|| 往期内容回顾

统计推断中的十二个重要概念

【Prism统计教程】高斯分布

【Tips】如何高效使用Prism作图?


img

最后编辑于 2022-10-09 · 浏览 1729

回复2 点赞

全部讨论0

默认最新
avatar
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部