第1章 程序员的统计思维
本书讨论如何将数据转换为知识。数据是廉价的(至少相对而言如此),但知识却异常宝贵。
我会介绍以下三门相互关联的学科。
- 概率论 主要研究随机事件。人们对某些事件发生的可能性高低一般都有直观的认识,所以未经特殊训练就会使用“可能”、“不可能”之类的词汇。但本书会介绍如何量化这种可能性。
- 统计学 统计学旨在根据数据样本推测总体情况。大部分统计分析都基于概率,所以这两方面的内容通常兼而有之。
- 计算 量化分析的最佳工具。计算机是处理统计量的常用工具。此外,计算实验还有助于理解概率论和统计学中的概念。
本书的主要目的就是要让懂编程的人通过编程来理解概率论和统计学。人们通常是从数学角度讲解概率论和统计学,而且很多人也因此学会了概率论和统计学。但在概率论和统计学中,有很多概念从数学角度很难理解,但如果用计算方法就比较容易。
记得我妻子怀上我们第一个孩子时,我听到过这样一个问题:第一胎多在预产期后出生吗?本章接下来介绍的例子就源自这个问题。