4.6 为什么需要模型

我在本章开头说过,真实世界的很多现象都可以用连续分布来建模。读者可能会问:“这有什么用?”

跟所有模型一样,连续分布也是一种抽象。换言之,就是会舍弃一些无关紧要的细节。例如,真实观察到的分布中可能会有测量误差或是对样本来说很奇怪的数据,而连续模型会消除这些无关紧要的细节。

连续模型也是一种数据压缩。如果模型能很好地拟合数据集,那么少量参数就可以描述大量数据。

有时候,我们会惊讶地发现某种自然现象服从某个连续分布,观察这些现象可以让我们深入理解真实的系统。有时候,我们可以解释观察到的分布服从特定形式的原因。例如,帕累托分布通常是正反馈生成过程的结果(也称为偏好依附:preferential attachment,详见 http://wikipedia.org/wiki/Preferential_attachment)。

连续分布可用于数学分析,我们会在第6章中介绍。