2.10 相对风险

我们一开始就提出了这个问题:第一胎宝宝出生较晚吗?让我们明确一下,如果宝宝在第37周或更早出生,那就是提前出生;准时出生则是在第38到第40周;而延后出生则是在41周或更晚。这类用于数据分组的范围称为区间(bin)。

习题2-6

建一个risk.py文件。编写函数ProbEarly、ProbOnTime和ProbLate,以PMF为参数,计算各个时间区间出生的婴儿所占的比例。提示:可以写一个通用函数实现这三个函数的功能。

准备三个PMF,一个是第一胎婴儿的,一个是非第一胎婴儿的,还有一个是所有婴儿的。计算每个PMF中提前出生、准时出生和延后出生的婴儿的概率。

可以用相对风险(relative risk)来概括类似的数据,它代表两个概率的比值。例如,第一胎提前出生的概率是18.2%。非第一胎婴儿提前出生的概率是16.8%,因此相对风险就是1.08。这意味着第一胎较其他几胎更早出生的可能性有8%。

编写代码确认该结果,然后计算准时出生和延后出生的相对风险。可以从http://thinkstats.com/risk.py下载答案。