7.3 效应的定义

当人们看到不寻常的事情发生时通常会感到稀奇,并问:“出现这种情况的可能性有多大呢?”这是因为人们在直觉上认为不大可能发生的事情会很少发生。但这种直觉并不总是能经得住推敲。

例如,假设我抛10次硬币,每抛一次我都将结果记录下来,用H表示正面朝上,用T表示反面朝上。如果得到的结果是THHTHTTTHH,或许大家不会觉得惊讶。但是如果结果是HHHHHHHHHH,人们可能会问:“这种可能性有多大呢?”

在这个例子中,两个结果序列相同的概率为1/1024。同样地,任意两个结果序列相同的概率也是1/1024。所以当我们问“出现这种情况的可能性有多大”的时候,必须明确“这种情况”具体是什么。

在NSFG数据中,我们将效应定义为“两个分组的均值差(不分正负)大于等于δ”。给定这个定义之后,我们只关注这个差值绝对值的大小,而不再关注它是正数还是负数。

上述类型的检验称为双边检验(two-side test),我们考虑了图7-1中分布的两边的情况(正的和负的)。在这里,双边检验的假设是两个分布的平均值有显著差别,而不关注相对大小。

与双边检验对应的是单边检验(one-side test)。 单边检验关注的是第一胎婴儿数据的均值是否显著高于非第一胎婴儿数据的均值。因为单边检验的假设更具有特异性,所以单边检验的p值会比较低,在这里大约是双边检验p值的一半。