6.7 分布函数之间的关系框架

到现在为止,我们已经了解了概率质量函数(PMF)、累积分布函数(CDF)和概率密度函数(PDF)等概念。我们回顾一下之前的这些内容,图6-1列出了这些函数之间的关系。

图6-1 分布函数之间的关系框架

我们从概率质量函数出发,它表示的是离散随机变量在各特定取值上的概率。按随机变量取值的大小将其概率值进行累加,就可以得到累积分布函数。本来为了命名的连贯性,我们应该将这里的累积分布函数称为累积质量函数,但到目前为止,还没有人用过这个词。

我们也可以从累积分布函数出发,通过差分运算得到概率质量函数。

同样地,概率密度函数是连续型累积分布函数的微分,反过来说,累积分布函数是概率密度函数的积分。这里要注意的是,概率密度函数表示的是一个值对应的概率密度而非概率,如果要计算概率,我们必须对概率密度进行积分。

我们可以运用多种方式将一个离散型的分布变成连续型的分布。例如,可以认为这些离散的数据来自一个连续型的分布(比如指数分布或者正态分布),然后利用这些数据估计分布的参数。这些内容我们将在第8章进行更深入地探讨。

假如我们将概率密度函数按一定的区间进行分段,然后在每一段分别进行积分,这样就将一个连续型的分布离散化了,得到了一个近似概率密度函数的概率质量函数。在第8章,我们将利用这个方法来做贝叶斯估计。

习题6-15

请编写一个名为MakePmfFromCdf的函数,用来将分布的CDF转换成对应的PMF。

访问http://thinkstats.com/Pmf.py查看本练习的答案。