众力资讯网

优思学院|统计学里最常被误解的数字:p 值的真正含义

面对统计检验时,很多人第一时间都会问一句:「p 值到底是什么意思?」这个数字经常出现在报告、论文、t 检验、ANOVA、

面对统计检验时,很多人第一时间都会问一句:「p 值到底是什么意思?」这个数字经常出现在报告、论文、t 检验、ANOVA、回归分析里,却也常被误解得最离谱。为了让概念更直观,我们不谈公式、不谈复杂符号,只从一个简单的场景开始想。

想像你统计了一组数据,例如比较两所学校学生的身高。你在 A 学校量了10个人,在 B 学校也量了10个人。结果发现两组的平均身高有些差异。

接下来,你可能希望用这些样本来推断整体情况:也就是说,或许 A 学校的学生平均来说比 B 学校的学生更高。

然而:有人走过来说,不,我对你的结果有不同的解释:你只是在你的样本中发现了差异,但整个学校都是一样的。你只是碰巧从A学校挑了高个子学生,从B学校挑了矮个子学生。

当批评者说“你的结果只是随机误差造成的”时,他们实际上是在主张零假设。因此,在继续任何分析之前,你必须先回应这种质疑:你得证明如果差异真的只是随机造成的,你的数据不会大概率呈现成现在这样。这总是有可能的,但你可以证明它不太可能,这就是你唯一能合理做的事情。

在零假设下找到你的数据的机率是p值。如果p值非常低,这意味着仅仅由于毒素的随机变化而找到你的影响的可能性非常小。

p 值(绿色阴影区域, 上图)是在原假设为真的前提下,出现某个观测结果(或更极端结果)的概率。

相反,如果p值不是那么低,你的数据与你所期望的只是由于噪音而产生的影响非常吻合。

每隔一段是说p值必须低于0.05才能够驳回零假设批评。由于你的p值更大,你不能说你的数据只是由于偶然性而足够出乎意料。相反,这种影响在统计学上并不显着。

请注意,p值始终是在给定假设下影响的机率。它不是零假设本身的机率,你不知道。你所说的只是数据与零假设不太一致。如果你想尝试假设分配一个机率,你必须使用贝叶斯方法并涉及先验。不过,在大多数情况下,我认为恰当地使用 p 值,已经足以支持这样一种主张:现有数据难以由零假设合理解释。