2.1 均值和平均值

前一章提到了三个汇总统计量,均值、方差和中位数,但没有解释它们的具体含义。在介绍其他内容之前,我们先来看看这三个统计量。

如果有一个包含n个值的样本xi,那么它们的均值μ就等于这些值的总和除以值的数量,即:

00002.jpeg

均值(mean)和平均值(average)在很多情况下可以不加区分地使用,但这里还要强调一下两者的区别:

  • 样本的“均值”是根据上述公式计算出来的一个汇总统计量;
  • “平均值”是若干种可以用于描述样本的典型值或集中趋势(central tendency)的汇总统计量之一。

有时候均值可以很好地描述一组值。例如,苹果大小都差不多(至少在超市里出售的苹果都是如此),因此,如果我买了6个苹果,总重量是3镑,那么就可以说每个苹果的重量大概是半磅。

但是南瓜就不一样了。假如我在花园里种了一些蔬菜,到了收获的时候,我收获了三个装饰用的南瓜,每个1磅重;两个制南瓜饼的南瓜,每个3磅重;还有一个重达591磅的大西洋巨型南瓜。这组样本的均值是100磅,但如果我告诉你:“我种的南瓜的平均重量是100磅。”那就有问题了,至少这也是一种误导。

在这个例子中,平均值是没有意义的,因为“典型”的南瓜是不存在的。