dxy logo
首页丁香园病例库全部版块
搜索
登录

GraphPad Prism 统计教程 | 置信区间(三)

最后编辑于 2022-10-09 · IP 北京北京
2608 浏览
这个帖子发布于 4 年零 177 天前,其中的信息可能已发生改变或有所发展。


img

本篇继续聊聊“置信区间”,主要关于置信区间、预测区间和容许区间三者的比较,以及标准偏差的置信区间


一、置信区间、预测区间和容许区间三者比较

当你将参数拟合到模型时,精度或精确度可表示为置信区间、预测区间或容许区间。这三者截然不同。Prism仅报告置信区间。

下面内容解释了将平均值拟合到数据样本的简单情况下的三个不同区间(假设从高斯分布中抽样)。相同的想法可应用于由回归确定的任何最佳拟合参数的区间。

[1] 置信区间

置信区间,表明了所确定的平均值程度如何。假设数据的确从高斯分布中随机抽样得到。如果你多次这样做,并计算每个样本中平均值的置信区间,那么你会预期95%的置信区间包括群体平均值的真实值。重点:置信区间可以告诉你真实群体参数的可能位置

[2] 预测区间

基于预测区间,可以预计在何处看到下一个抽样数据点的位置。假设数据的确从高斯分布中随机抽样得到。收集数据样本并计算预测区间。然后从群体中再抽取一个值。如果你多次这样做,你预计下一个值位于95%样本的预测区间内。重点:预测区间可以告诉你值的分布,而非确定群体平均值的不确定性。

预测区间必须考虑知道群体平均值的不确定性以及数据离散性。因此预测区间始终比置信区间更宽。

(在继续讨论容许区间之前,让我们定义在定义预测区间时使用的“预计”一词。意思是,你有50%的机会在95%以上的样本中看到区间内的值,以及有50%的机会在少于95%的样本中看到区间内的值。)

[3] 容许区间

如果你想要95%确定该区间包含95%的值,应该怎么做?或者90%确定该区间包含99%的值?如需计算或理解容许区间,必须指定两个不同的百分比。一个表示你想确定的程度,另一个表示区间将包含的值的分数。如果你将第一个值(确定的程度)设置为50%,则容许区间与预测区间相同。如果你将其设置为一个较高值(例如,90%或99%),则容许区间会更宽。


标准偏差的置信区间

几乎可以为根据数据样本计算的任何值计算置信区间,包括SD。

回顾“标准差”→GraphPad Prism 统计教程 | 什么是标准差?


[1] 单样本SD与群体SD不同

根据值样本计算SD非常简单。但SD的准确度如何?你可能碰巧获得紧密结合的数据,从而导致SD很低。或者你可能随机获得相比总群体更为分散的值,从而导致SD很高。你样本的SD不等于群体的SD,甚至与之相差甚远。

[2] 置信区间不仅仅用于计算平均值

置信区间通常用于计算平均值。但置信区间的概念非常普遍,你可以将任何计算值的精度表示为95%置信区间(CI)。另一示例是回归最佳拟合值的置信区间(例如,斜率的置信区间)。

[3] SD的95% CI

样本SD只是你根据数据样本计算的一个值。虽然并不经常这么做,但其确实有可能计算一个SD的CI。Prism不进行此计算,可以试试免费的GraphPad QuickCalc(免费的GraphPad在线计算器)。

SD CI的解释非常简单。如果你假设数据是从高斯分布中随机独立抽样,则有95%的概率确定CI包含真正的群体SD。

SD的CI有多宽?当然,答案取决于样本量(n)。对于小样本,区间相当宽,如下表所示,

img

[4] 示例

数据:23、31、25、30、27

平均值:27.2

SD:3.35

根据五个值计算出的样本SD为3.35。但值抽样群体的真正SD可能大不相同。从表的n = 5行来看,95%置信区间从0.60*SD扩展到2.87*SD。因此,95%置信区间的范围为0.60*3.35到2.87*3.35,2.01到9.62。当你仅根据五个值计算SD时,SD的95%置信上限几乎是下限的五倍。

大多数人对小样本的SD定义如此之差的事实感到惊讶。随机抽样会对小数据集产生巨大影响,从而导致计算出的SD与真正的全体SD相差甚远。

请注意,置信区间并非围绕计算的SD对称分布。为什么?由于SD始终是正数,因此置信下限不能小于零。这意味着上置信区间通常在样本SD上方延伸,而下置信区间在样本SD下方延伸。使用小样本时,这种不对称性非常明显。

[5] 使用Excel计算SD的CI

这些Excel方程计算SD的置信区间。n是样本量;95%置信度的α为0.05,99%置信度的α为0.01等:

下限:=SD*SQRT((n-1)/CHIINV((alpha/2),n-1))

下限:=SD*SQRT((n-1)/CHIINV(1-(alpha/2),n-1))

这些方程来自Sheskin出版物第197 - 198页(详见*参考文献)。

*参考文献:David J. Sheskin, 《参数和非参数统计程序手册》,第四版,IBSN:1584888148。


|| 往期内容回顾

如何利用GraphPad Prism计算标准差?


img

回复8 1

全部讨论(0)

默认最新
avatar
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部