5针系统适用性引发的讨论
统计学上的两类错误-一个略黄略暴力的故事[2]
话说N年过去了,某位性别不明的地球统治者决定要消灭地球上的男人们。但是怎样找到地球上所有的男人并把他们都消灭呢?这位统治者开发出了一种自动判别武器:如果胸小于A罩杯,则杀无赦;如果等于或大于A罩杯,则放过。
如果用统计学的语言来说,由于武器旨在找出男人放过女人,每当它碰到一个没见过的人时,它就先假设这是个女人(「原假设」),如果这人罩杯太小,那就认为这肯定不是个女人(「推翻原假设」)。不是女人那还能是啥?男人呗(「接受备选假设」)。
腥风血雨过后,结果不难想象:绝大部分的男人都不带走一片云彩地离开了这个世界,而绝大部分女人都还在愉快地生活着,然而有些可怜的mm因为胸太小被误杀,有些胸肌发达的gg却因为胸很大而活了下来。
在这里,武器的判别程序犯了两种错误:
- 把一小部分小胸女人当成了男人,也就是在原假设其实为真时错误地拒绝了它,这在统计学中被称为「第一类错误」;
- 把一小撮大胸男人当成了女人,也就是在原假设其实为假时错误地接受了它,这在统计学中被称为「第二类错误」。
我们通常用一对希腊字母⍺和β来代表犯第一类和第二类错误的概率。在这个故事里,⍺就是被错杀的女人在所有女人中的比例,而β则是被放过的男人在所有男人中的比例。
上述案例中,我们的目标是通过连续5针的样本数据,推测仪器性能(总体)RSD不大于2%的可靠程度,经过假设检验及功效检验,所犯第一类错误和第二类错误的概率较低,系统适用性检验通过。
讨论
将上述案例标准差扩大1倍,即RSD扩大一倍,标准差比值扩大一倍,原假设标准差保持不变(还未到达最差条件),如果 σ < 95575为真,正确地拒绝原假设σ = 95575的概率仅为53%左右,犯第二类错误的概率太高。
- 现阶段国内的仪器条件,连续进样5针,样本RSD通常比较低,使得总体能够达到RSD不大于2%的要求;
- 当出现样本RSD比较高时,尽管符合要求,样本量较小,功效较低,犯第二类错误的概率较高,并不能保证下一针系统适用性重复性通过。
- 进样针数取决于样本量,样本RSD,系统适用性的通过要求(中国药典2%)及显著性水平(通常0.05),系统适用性通过要求越严格,样本RSD越高,需要的样本量越高。
思考
- 每次检测样品前,有时RSD会超过2%,实验室没有找到原因,重新进样,直到合格为止。出现这种不合格真是偶然吗?
- 含量检测标准在98%至102%,美国药典要求连续进5针的RSD不超过0.73%,有道理!
最后编辑于 2022-10-09 · 浏览 4115